yphacker大佬聊赛事:要想做好【肺炎X光病灶识别】,可以从这 3 点入手

AI研习社 AI开发者 昨天
 点击上方“蓝字”关注“AI开发者”



坐镇大佬


 BOSS


yphacker(AI 研习社 ID:yphacker),深度学习的爱好者。


“肺炎X光病灶识别(第二期)”赛事链接:https://god.yanxishe.com/23

(点击底部 阅读原文 即可了解更多赛事详情)


AI 研习社:请问大佬是哪里人?家乡的疫情还算严重吗?
yphacker:湖北;还是很严重的,湖北省各地区基本都封市了。

AI 研习社:大佬多保重!在你看来,面对这次疫情,开发者群体可以有哪些作为?
yphacker:首先是待在家,哪也不去;其次,如果精力充足的话,可以积极参加到开源项目(https://github.com/wuhan2020/wuhan2020)里面为社会做点贡献。Wuhan2020项目介绍请戳此查看:如何加入到 wuhan2020 开源项目,打赢这场没有硝烟的战争?

AI 研习社:你本人对 AI 医疗这块了解得多吗?如何看待 AI 在这个领域的作用?
yphacker:有了解过  AI  医学问答,能够提高诊断能力、帮助快速决策等。

AI 研习社:全国上下都在密切关注本次疫情,所以稍微偏了下题。重新回到“肺炎疫情攻防战--肺炎 X 光病灶识别”赛事来,能不能请你解读一下前一次赛事的冠军代码(链接:https://www.yanxishe.com/codeplan/detail/32)对小白用户的借鉴意义?
yphacker:我个人总结出以下 3 点:
  1. 数据处理:将样本数量较少的样本 3、4 当做  2  来处理
  2. 模型选择:由于  bbox  标记较粗糙,采用分类模型
  3. 模型融合:采用 5 折模型自融合,以及一些不同模型之间的融合

AI 研习社:稍微追问一下,这个数据处理方式背后的原理是什么?是否与本次赛题数据集的特征有关?
yphacker:因为数据集中存在样本不均衡的问题。将类别为 3 和 4 的样本当做 2 来处理,由于样本类别减少,模型处理时间也会相应减少,精度有可能会下降(这主要取决于测试集)。

AI 研习社:在原来冠军代码基础上,你认为还有哪些解题思路可以继续优化?
yphacker:可以从如下 3 个方面入手:
  1. 尝试更多不同的模型
  2. 尝试不同的处理样本不均衡问题的方法
  3. 尝试利用  bbox  部分信息

AI 研习社:我帮小白用户问一句,前期需要培养哪些基本功,才能够具备像你本人一样的赛题拆解能力?
yphacker:在我看来至少有 3 点:
  1. 了解至少一种深度学习框架
  2. 了解 nlp or cv 的基本模型
  3. 了解一些优化方法

AI 研习社:在你心目中,什么才是“打比赛的正确姿势”?
yphacker:赛中多尝试一些方法,赛后多看大佬代码总结;认识更多志同道合的人。
/ 扫码了解比赛更多内容 /










 点击 阅读原文,进入肺炎疫情攻防战--肺炎X光病灶识别比赛(第二期)