3月

2.29 - 3.10

  • 《基于 LiDAR 的多模态人体动作捕捉》论文学习 + blog笔记

磨刀不误砍柴工,知道了人体动作捕捉这一套流程(虽然知道的有限),便于之后的毕设工作开展

  • 跑通 LiDARCap 代码

代码在 【/data/liumengyin/forder1/lidarcap_1】目录下

训练 200 个 epoch 需要 10h 左右

  • 可视化工具尝试(aitviewer, o3d_server)

aitviewer比较复杂,可以对齐SMPL模型和图像,看文档花了很长时间,还知道了 3DPW 数据集

后一个是实验室学长写的,只能显示SMPL模型

  • DINO-v2 tutorial

3.11 - 3.24

  • 开题报告 + PPT

  • 回 HDU 开题答辩

  • 乌镇旅游

3.25 - 3.31

  • 下载 mmBody 数据集,跑通 ImmFusion

数据集是未裁剪人体部分的,训练集150G,测试集100G

跑通比较顺利,基本就把 num_workers 置 0 就好了

  • 学习 ImmFusion 论文和代码具体内容

论文看了好几遍,这时老师已经提出换图像特征提取器的idea,那么就需要找到替换的接口。

代码结构此时对我而言还是比较复杂,一度想尝试复现代码,但是评估了一下工作量之后放弃了

4月

4.1 - 4.14

  • 在原始代码上训完 mmBody

训练速度特别慢,分段训练完差不多需要2周。尝试了多卡训练(报错失败)、减小参数、增加batch size,还是挺慢的

不过在此过程中学会了用 smplx 官方代码修改命令行参数的方式可视化测试结果

最后的测试定量指标:mpjpe 77,pa-mpjpe 37

定性结果:看起来有明显提升

  • 看了 dino-v2 微调(adapter方式)

感觉是可行的,大概是在 dinov2 网络结构中加入一个小的可训练参数的网络,其他部分冻结参数

  • 和 ShangHai Tech 老师交流

上午听讲座,下午组会单独交流

感受是着实被拓宽了视野。在我的方向方面两位老师的水平可以说远高于我自己的导师,感受到他们不仅能想出idea而且落实得很漂亮

  • ECCV 论文审稿

因为自身对这个领域知识的了解匮乏,导致无法达到审稿的水平

4.15 - 4.30

  • 换 lidarhuman26M 数据集跑

具体就是按照 命令汇总 中的方法调整数据集格式

这时还没有预提取图像特征,跑完这个数据集也要14天(甚至50个epoch),对比LiDARCap方法跑200个epoch也才需要半天,训练时间亟待减少

  • 尝试减少训练时间

为了跑完计划的6个实验(2个数据集 * 3个图像特征提取器),我的想法是首先将训练时间变得可控

a. 把网络参数调小,然而改变不大

b. 修改网络结构,例如去掉local_feat等,改来改去最短缩短到10天左右,还是太慢

这时候已经没辙了。师姐建议我换成预先提取图像特征,我又发现CPU占用率很高(1000%+),经检查代码里含有图像resize操作,我把resize去掉,也换到预处理代码中去做

  • 使用预训练模型 DINOv2、HRNet、ResNet 分别提取图像特征并保存

一边提取特征和resize图像,一边train模型,并行处理加快进度

预提取特征之后训lidarhuman26M大概需要2天✌

  • 解决指标问题

训练时间可控之后,指标问题又来了

大概是 mpve 200+,但是mpjpe和pa-mpjpe都只有几,相差快两个数量级

首先确认代码计算指标的部分是没问题的,师姐说可能是约束不够,所以我修改了loss,在joint和vertices的损失外增加了关节旋转矩阵的损失,然而依然无济于事,定量指标相差很大,定性结果虽然也比较差,但显然指标就是不对劲的

这时由于毕业论文的写作迫在眉睫,所以暂时也无暇顾及这个问题了

5月

5.1 - 5.19

  • 边改实验,边思考毕设工作量,边完成毕业论文写作

lidarhuman26M的结果先做好了(包括关节旋转分支

在2天之内解决了reli11d数据集的格式处理和跑结果两部分,而且定性结果出乎我预料的好(前面的失败都在为此时的成功铺路!我太牛了!!)

毕设的工作量纯看跑了哪些实验(没有一个实验是白跑的),论文内容也是根据跑出的实验临时决定的,原本5.15都还觉得处理reli11d的数据集格式太麻烦了不想做了,结果后脚马上就解决了,只能说自己的潜力还是很大的,这两个月的确能力得到了很大锻炼(只是希望下次别这么极限了)

关于指标问题,reli11d上仍然存在上述问题,因此我认为是数据集的单位存在问题导致的

5.20 - 5.31

  • 毕业论文降重、写致谢

参考师姐的部分太多,从16%降到10%

致谢想了挺久的,自认为写得还不错

  • 毕设答辩PPT制作,准备答辩

答辩超级水,可惜我花时间做了老久了

6月

6.1 - 6.14

  • 拍毕业照
  • 休息

6.15 - 6.19

  • 组会汇报了一篇 3DGS 的论文

6.20 - 7.4

  • 毕业
  • 旅行
  • 摆烂

7.5 - 8.31

  • 研究生手册
  • 配置 Sparse 3DGS 环境
  • 跑步 & 健身