利用深度学习增强癌症诊断和分类

Predicting Lung Cancer Mutations with Machine Learning

课题背景

对病理学家来说,最困难的工作非判断患者是否罹患癌症莫属,诊断结果至关重要。然而病理切片的检查又极其复杂,病理学家需要经过多年的训练,再加上丰富的专业知识和经验才能胜任。尽管如此,人类病理学家也会出现误诊和漏诊。如果癌症能尽早发现并及时治疗,死亡率就可以降低。于是,人们就研究如何通过深度学习算法,训练机器学习切片检查来发现并预测癌症,从而提高诊断的效率,对病理学家和患者来说都是很大的帮助。

课题内容

本课程针对用于DNA,RNA和蛋白质序列分析的计算和统计方法以及软件工具。重点是了解这些方法的算法和数学基础,相关基因组学工具的设计及其应用。为学生介绍一整套编程作业,提供学术动手实践的旅程,使他们可以了解真正的基因组数据的复杂性。

 

其中包括:基因组组装程序的基本组件,将序列集映射到基因组(例如通过高通量测序生成的序列(例如Illumina / Solexa和454),BLAST样式的搜索工具,用于基因预测的HMM算法,后缀树,基序)转录因子启动子的预测以及单核苷酸多态性,单倍型和拷贝数遗传变异的基因组定位本课程有多个统一的主题,例如比对、比较基因组学,蛋白质结构,RNA在调控基因组中的新作用以及强大的基因组工具设计中统计数据和算法的相互联系。

教授信息

加州大学尔湾分校的生物统计学教授。北卡罗琳娜州大学生物统计学家。在学术界内,因为擅长运用机器学习技术结合跨领域的学科进行实证分析研究而获得“最年轻终身教授”的称号。研究曾获得过Leonard J. Savage Award (国家级学术成就奖),论文经常发表在四个最重要的A类期刊 (jrssb aos jasa biometrika), 在学术界颇有口碑。

​科研流程

学术评估

提交申请材料

导师30分钟电话面试

​推荐参加预备课程

成绩达标后安排教授面试

​教授测评后制定课题

​制定延伸方案*

科研形式

时间跨度 16 周

教授每周指导 4 小时*
线上  + 线下
教授亲自授课
博士助教全程跟进

​双师助力论文发表

预备课程

文献阅读

基础统计与线性代数
医学图像分类与标记
R语言、LaTeX语言基本语法

常用的科学计算包
机器学习理论框架

收获成果

美国教授推荐信

美本认可的国际期刊发表

美国一流科研竞赛*

​独一无二的科研课题*

​第一作者发表