最新好文

谷歌发布AI新品Gemini，AI技术迎来新篇章

12月7日传来新闻，继5月份开发者大会上首次露面后，谷歌不负众望，经过7个月的精心打磨，终于推出了一款名为Gemini的AI大模型。这款被称作Gemini 1.0的模型是谷歌至今推出的最为强大、最为通用且最为灵活的人工智能产品。

谷歌在其官方公告中透露，针对各行各业的不同需求，Gemini推出了三款不同版本。首先是功能最为强大的一款，适用于处理高度复杂任务的Gemini Ultra。其次是一款最适合各类任务的Gemini Pro，以及为手机等移动设备量身打造的高效模型Gemini Nano。

Gemini不仅在技术上有所创新，在与其他竞品的直接比较中也显示了其卓越性能。据谷歌所述，Gemini在除HellaSwag数据集以外的所有基准测试中均领先于OpenAI的GPT-4，这为其超级性能提供了有力证据。在32项被广泛应用于大型语言模型研究与开发的学术标准中，Gemini Ultra在其中30项上超越了目前最高水平。

令人瞩目的是，Gemini Ultra在大规模多任务语言理解测试（MMLU）中以90.0%的成绩超越了人类专家。此测试集结了数学、物理、历史、法律、医学及伦理等57个科目的知识点，考验模型在世界知识及问题解决能力方面的表现。另一个新的多模态任务基准测试MMMU中，Gemini Ultra也取得了令人赞叹的59.4%的成绩。

这个里程碑式的模型展现了它在处理复杂的书面文档和视觉信息方面的能力，以及在海量数据中发现难以察觉的知识内容。Gemini 1.0经专门训练，能够辨认并理解文本、图像、音频等多种形态的信息。这意味着，当问及与复杂主题相关的问题时，其细腻的信息理解能力尤为凸出，尤其是在数学和物理等复杂科目的推理解释方面。

Gemini对编程语言的理解和编码能力也十分值得关注。第一代Gemini能够理解、解释并生成Python、Java、C++和Go等世界上最流行的编程语言的高质量代码。

谷歌表示，采用Gemini Pro微调版的Bard将提供更高级的推理、规划和理解等服务，并计划在170多个国家和地区推出英语服务，未来还将扩展至不同的模态，以及支持更多新的语言和地区。在智能手机领域，谷歌Pixel 8 Pro将成为首款搭载Gemini Nano的设备，带来录音应用中的“总结”等新功能，以及Gboard推出的“智能回复”功能。

未来几个月中，谷歌将进一步将Gemini技术应用于搜索、广告、Chrome和Duet AI等服务中。从12月13日开始，开发者和企业客户已能通过Google AI Studio或Google Cloud Vertex AI的Gemini API访问Gemini Pro。

谷歌对外宣称，Gemini的发布标志着AI技术发展过程中的一个重要里程碑，同时也代表着谷歌进入一个全新纪元的开端。随着Gemini的持续发展和完善，我们有理由相信，未来AI在多领域的应用将变得愈发智能和高效。