首页 > 科技 >

大模型革新进展:从海量教学视频中萃取顶级多模态教科书资源

发布时间:2025-01-20 19:47:48来源:

浙江大学与阿里巴巴达摩院合作发布了一项研究,旨在利用教学视频创建高质量多模态教科书,为大规模语言模型训练提供新思路。研究团队从互联网收集并筛选出75,000个高质量教学视频,涵盖多个学科,总时长超过22,000小时。通过复杂处理管道,这些视频被转化为内容丰富、结构严谨的多模态教科书,显著提升了知识密度和图像关联性。

该研究成果引起了学术界的广泛关注,相关数据集在Hugging Face平台上迅速走红,两周内下载量超7000次。研究者希望这一创新不仅能推动语言模型发展,还能为教育资源的整合与应用开启新篇章。

免责声明:本答案或内容为用户上传,不代表本网观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 如遇侵权请及时联系本站删除。