AI 研习社:请问大佬是哪里人?家乡的疫情还算严重吗?yphacker:湖北;还是很严重的,湖北省各地区基本都封市了。 AI 研习社:大佬多保重!在你看来,面对这次疫情,开发者群体可以有哪些作为?yphacker:首先是待在家,哪也不去;其次,如果精力充足的话,可以积极参加到开源项目(https://github.com/wuhan2020/wuhan2020)里面为社会做点贡献。Wuhan2020项目介绍请戳此查看:如何加入到 wuhan2020 开源项目,打赢这场没有硝烟的战争? AI 研习社:你本人对 AI 医疗这块了解得多吗?如何看待 AI 在这个领域的作用?yphacker:有了解过 AI 医学问答,能够提高诊断能力、帮助快速决策等。 AI 研习社:全国上下都在密切关注本次疫情,所以稍微偏了下题。重新回到“肺炎疫情攻防战--肺炎 X 光病灶识别”赛事来,能不能请你解读一下前一次赛事的冠军代码(链接:https://www.yanxishe.com/codeplan/detail/32)对小白用户的借鉴意义?yphacker:我个人总结出以下 3 点:
数据处理:将样本数量较少的样本 3、4 当做 2 来处理
模型选择:由于 bbox 标记较粗糙,采用分类模型
模型融合:采用 5 折模型自融合,以及一些不同模型之间的融合
AI 研习社:稍微追问一下,这个数据处理方式背后的原理是什么?是否与本次赛题数据集的特征有关?yphacker:因为数据集中存在样本不均衡的问题。将类别为 3 和 4 的样本当做 2 来处理,由于样本类别减少,模型处理时间也会相应减少,精度有可能会下降(这主要取决于测试集)。 AI 研习社:在原来冠军代码基础上,你认为还有哪些解题思路可以继续优化?yphacker:可以从如下 3 个方面入手:
尝试更多不同的模型
尝试不同的处理样本不均衡问题的方法
尝试利用 bbox 部分信息
AI 研习社:我帮小白用户问一句,前期需要培养哪些基本功,才能够具备像你本人一样的赛题拆解能力?yphacker:在我看来至少有 3 点:
了解至少一种深度学习框架
了解 nlp or cv 的基本模型
了解一些优化方法
AI 研习社:在你心目中,什么才是“打比赛的正确姿势”?yphacker:赛中多尝试一些方法,赛后多看大佬代码总结;认识更多志同道合的人。/ 扫码了解比赛更多内容 /