2023年是生成式AI的重要一年,它从研究实验室走向现实,数百万人通过ChatGPT和Microsoft Copilot等流行工具使用它。今年,AI预计将变得更加易于访问、更具细微差别,并集成到改进日常任务和帮助解决一些世界上最具挑战性问题的技术中。
以下是2024年值得关注的三个重要AI趋势。
小型语言模型
如果你使用过Copilot回答复杂问题,你就已经体验过大型语言模型(LLMs)的强大。由于这些模型非常庞大,运行时可能需要大量计算资源,因此小型语言模型(SLMs)的兴起变得尤为重要。
虽然SLMs仍然相当大,拥有数十亿参数(相比之下,LLMs拥有数千亿参数),但它们足够小,可以在手机上离线运行。参数是决定模型行为的变量或可调元素。
“由于其规模和经济性,小型语言模型可以使AI更容易获取,”微软研究院机器学习基础组负责人Sebastien Bubeck说。“同时,我们正在发现新的方法,使它们和大型语言模型一样强大。”
微软研究人员已经开发并发布了两个SLMs——Phi和Orca——在某些领域表现得和大型语言模型一样好甚至更好,挑战了规模是性能所必需的观念。
与在大量互联网数据上训练的LLMs不同,这些较小的模型使用经过精心挑选的高质量训练数据,研究人员发现了规模与性能的新门槛。今年,你可以期待看到改进的模型,旨在促进更多的研究和创新。
多模态AI
大多数LLMs只能处理一种数据类型——文本,但多模态模型可以理解来自不同数据类型的信息,如文本、图像、音频和视频。这种能力使从搜索工具到创意应用程序的技术变得更丰富、更准确、更无缝。
你可以通过Copilot了解上传图像中的情况,这得益于一个可以处理图像、自然语言和Bing搜索数据的多模态模型。Copilot可以生成例如你照片中某个纪念碑的历史意义等相关信息。
多模态AI还为Microsoft Designer提供支持,这是一款可以根据你的描述生成图像的图形设计应用程序。它还支持自定义神经语音,这些自然音质的语音在文本阅读器和帮助有语言障碍的人士的工具中非常有用。
“多模态能力可以创造出更人性化的体验,能够更好地利用我们作为人类使用的一系列感官,如视觉、听觉和听力,”微软首席技术官办公室首席工程师Jennifer Marsman说。
科学领域的AI
专家们预测,旨在加速科学发现的AI工具将取得重大进展,其中大部分工作旨在解决全球性问题,如气候变化、能源危机和疾病。
为了减缓气候变化并帮助农民更高效地工作,微软研究人员正在使用AI构建更好的天气预报器、碳估算器和其他可持续农业工具。他们还在开发能够帮助现场农民的AI技术,包括一个可以帮助农民识别神秘杂草或使用农场特定数据比较不同灌溉方法效率的聊天机器人。
在生命科学领域,研究人员正在合作开发全球最大的基于图像的AI模型以对抗癌症并使用先进的AI发现治疗传染病的新药和突破性药物的新分子。这些技术将可以压缩科学试验和错误的时间——这些工作通常需要数年——到几周或几个月。
AI还在改变材料科学,这是一门致力于创造具有特定属性的新材料的广泛领域。最近的一项突破展示了AI和高性能计算如何加速寻找更少毒性电池材料的过程。
“人工智能正在推动科学发现的革命,”微软研究院AI4Science团队主任Chris Bishop说。“这可能会成为AI最令人兴奋且最终最重要的应用。”