北京科技大学一才子勇夺GitHub热门项目榜首,全球独占鳌头

 

凭借学生身份,他独立发表了6篇高水准学术论文,其谷歌学术引用量已超600次,作为第一作者的论文引用量亦超过500次。他是LLaMA-Factory开源项目的主要推动者,该项目单个项目收藏量突破4万,成为国内大语言模型微调领域最受欢迎的框架,并在GitHub热门项目榜单上位居全球第一。他受邀进行10余场主题演讲,荣获华为昇腾生态开源卓越贡献奖及中国电信魔乐社区卓越贡献合作伙伴称号。作为开源技术领域的先锋,他目前是计算机学院2022级博士研究生——郑耀威。

图片[1]-北京科技大学一才子勇夺GitHub热门项目榜首,全球独占鳌头-蜗牛资源分享网

郑耀威的学术成就与个人成长

大会演讲的契机

从AI的崛起中汲取动力

2016年,AlphaGo在围棋赛场上战胜世界冠军的壮举震撼了全球。当时正忙于高考的郑耀威,被人工智能的神奇魅力所吸引,立志在AI领域有所建树。进入北京航空航天大学后,他迅速投入到人工智能的学习和研究之中。

在大一阶段,郑耀威就展现出了极高的学习热情。他不仅自学了多门专业课程,还积极参与各类竞赛,并主动加入了实验室,每一步都扎实前进。在课余时间,他自学了包括Python、概率论、机器学习、深度学习在内的6门专业公开课,累计学习时间超过800小时,为他的专业学习打下了坚实的基础。郑耀威表示:“是AlphaGo让我踏入了人工智能的领域,而北航优秀学长学姐们的成就则激励了我追求创新的决心。”他目睹了学长学姐们在AI领域的卓越表现,从而更加坚定了自己的志向。

图片[2]-北京科技大学一才子勇夺GitHub热门项目榜首,全球独占鳌头-蜗牛资源分享网

郑耀威在大二时期,为了更专注于学术研究,主动加入了计算机学院张日崇教授的科研团队。刚开始,他主要负责实验操作和代码阅读,但他始终坚信“每日进步”的重要性。每周,他穿梭于沙河与学院路之间,这段充满艰辛的旅程成为了他科研创新的起点。在本科二年级的暑假,他选择留在学校进行科研工作,日复一日地沉浸在实验室的讨论、建模和调试中,他感慨地说:“那时每一天都感到非常充实。”

郑耀威的人生信条是“博观而约取,厚积而薄发”。他专注于学术,全神贯注于科研问题的钻研。与导师张日崇教授和高年级同学的频繁交流,每天三四次的深入讨论,不断激发了他的创新思维和灵感。在低资源场景的机器学习技术研究上,他面对挑战,不断尝试、总结和提升,以第一作者的身份在国际顶级会议ACL、CVPR、AAAI、WWW上发表了多篇论文,其中包括6篇学生一作论文。

在科研之外,郑耀威也热衷于参与各种课外科技竞赛。他提出的“基于语法图上随机游走的多方面情感分类”项目赢得了北航冯如杯科技竞赛的一等奖。他还开发了自动检测心脑血管疾病的算法,在 全国数字健康创新应用大赛中荣获算法模型一等奖。此外,他还获得了全国大学生冰壶人工智能挑战赛的总冠军、蓝桥杯信息技术大赛全国一等奖等多项专业竞赛奖项,充分展现了北航学子的优秀品质和创新精神。

图片[3]-北京科技大学一才子勇夺GitHub热门项目榜首,全球独占鳌头-蜗牛资源分享网

郑耀威荣获全国数字健康创新应用大赛一等奖

“竞赛并非终点,而是培养创新精神的途径。”郑耀威如此阐述。对他而言,最难忘的经历是数学建模的美赛,连续三天两夜的拼搏,与队友轮流熬夜,一边搜集资料一边编写代码,这段经历极大地增强了他的团队协作能力。这些实践经验不仅增强了他的技术技能,还锻炼了他应对压力和未知情况的能力。

拥抱开源,大模型助力

“互联网的精髓在于自由、开放和共享。”2022年底,ChatGPT的问世彻底点燃了人工智能领域,以大模型为核心的人工智能技术深刻影响了学术、生产和生活的多个方面。郑耀威在受到启发的同时,也注意到了大模型微调和推理所需的资源消耗巨大,这阻碍了AI的落地应用,并且GPU资源被大型企业所垄断,为研究人员和开发者设置了诸多障碍。他表示:“开源技术打破了信息壁垒,我希望通过我的项目,让每个人都能充分利用大模型。”

为此,他将研究的焦点完全放在了大模型微调框架上。基于第一代LLaMA开源大模型,结合自己在低资源场景机器学习领域的深厚技术积累,经过数月的深入研究和开发,他成功在该框架中实现了大语言模型的量化和低秩分解技术,显著降低了模型的显存消耗,并将训练成本降低了30倍。利用这一技术,他构建了高效的大模型微调框架LLaMA-Factory,并将其开源至GitHub平台。

图片[4]-北京科技大学一才子勇夺GitHub热门项目榜首,全球独占鳌头-蜗牛资源分享网

LlamaFactory项目广受认可,国内外众多机构纷纷关注

自项目提出以来,便引起了广泛关注,众多社区开发者纷纷提出需求,尤其是在国产化计算环境中的应用需求。为此,郑耀威深入研究各类硬件平台文档,成功研发出硬件感知的自动优化方案,使得LLaMA-Factory能够在英伟达和国产芯片上无缝运行。这一成就获得了华为昇腾芯片部门的高度评价,郑耀威也因此荣获华为昇腾生态开源卓越贡献奖。

图片[5]-北京科技大学一才子勇夺GitHub热门项目榜首,全球独占鳌头-蜗牛资源分享网

郑耀威荣获中国电信魔乐社区的杰出贡献合作伙伴称号。他表示:“参与开源项目的维护确实面临不小的压力,但既然这是代表我们实验室的工作,我就决心要把它做到最好。”在持续提升项目功能的过程中,他始终积极回应社区开发者的疑问和建议。凭借他的持续努力,该项目的声誉在社区内日益提升,受到了广泛的赞誉和热烈欢迎。到2024年初,项目在GitHub上获得了1万颗星标,至今累计超过4万颗星标,成为国内最受欢迎的大语言模型微调框架,并登顶GitHub全球热门项目排行榜。

© 版权声明
THE END
喜欢就支持一下吧
点赞10 分享