数字巨头之间的技术竞争正在加剧,尤其是谷歌和 ChatGPT 的创造者 OpenAI 之间的竞争。这种竞争正在推动人工智能的大规模投资和快速发展,重塑全球技术格局。
通过 Gemini,Google 推出了新的大型语言模型 (LLM),它继承了 PaLM 2。 目标:打败 OpenAI 的 GPT-4,并在与 ChatGPT 的竞争中胜出。 除了聊天机器人 Bard 之外,Pixel 8 Pro 和 Android 也受益于新的 AI 功能。
与 GPT-4 一样,它是多模态 AI 模型,因此除了文本之外,它还可以处理图像、视频和音频进行输入和输出。 据说主要进展之一就在这一领域。 由于该模型能够以更加差异化的方式捕获信息,因此它应该能够在数学和物理等复杂学科中提供更好的答案。
Gemini 1.0 提供三种版本:
- Gemini Ultra:适用于复杂任务的最强大、最大的模型
- Gemini Pro:适合大多数任务的中间版本。
- Gemini Nano:最小、最高效的模型,也应该在用户设备上运行。
根据技术报告,Nano 还分为两个版本:一个有 18 亿个参数,一个有 32.5 亿个参数。 对于 Pro 和 Ultra,Google 没有提供有关模型的任何信息。
谷歌用自己的基准测试来支持所承诺的性能飞跃。 因此,在大多数情况下,Ultra 变体的性能优于 GPT-4 或 GPT-4 Vision。 Gemini 不仅应该比它的前辈更强大,而且效率也明显更高。
Bard 和 Gemini Pro
Gemini Ultra 尚未推出使用。 目前信任和安全检查正在进行中,模型仍在优化。 这是通过微调和强化学习来完成的,这是一个基于人类反馈的过程。 为此,第一批客户和合作伙伴已经可以访问。
明年,将发布 Bard Advanced,这是 ChatGPT 竞争对手的修订版,可以受益于 Ultra 功能。 总体而言,Ultra 预计要到 2024 年才会启动。
之前版本的 Bard 已经有了 Gemini Pro 的新技术基础,现在已经可以使用了。 这应该能让聊天机器人更快地处理信息;谷歌称这是自推出以来质量的最大飞跃。 新版 Bard 首先在 170 多个国家和地区提供英文版本。 欧洲还不是其中之一。 但其他语言和国家即将推出。
Pixel 8 Pro 和 Android 获得新的 AI 模型
小型 Nano 模型旨在加速智能手机上的人工智能功能并实现创新。 Pixel 8 Pro 上首先会出现这种情况。 有了 Gemini Nano,以后可以在录音机应用程序中汇总设备上的录音。 还可以使用 Gboard 键盘制定“智能”答案。 该功能最初将在 WhatsApp 上推出,其他即时通讯工具也将跟进。
Pixel 8 Pro(测试版)仍然是谷歌人工智能创新的发挥方式。
Gemini 将在未来几个月内整合到其他服务中。 其中包括 Google 搜索、广告、Chrome 和 Duet AI。 新的谷歌搜索 – 搜索生成体验(SGE)- 补充了生成式人工智能功能,目前仍处于实验状态,也正在接受 Gemini 支持进行测试运行。
适用于 Android 开发人员的 Gemini
不过,从 12 月 13 日开始,开发者和企业客户将能够通过 Google AI Studio 或 Google Cloud Vertex AI 中的 Gemini API 访问 Gemini Pro。 对于 Android 开发人员来说,AICore 是一项在早期预览版中提供的新系统功能,可用于开发支持 Gemini Nano 的应用程序。 在此类应用中,模型可以直接在设备上运行。
作为 Gemini 公告的一部分,谷歌还推出了新版本的“张量处理单元”(TPU)。 Gemini 使用 TPU v4 和 v5e 版本进行训练。 TPU v5p 也可在谷歌云中使用;谷歌承诺对现代人工智能模型进行特别有效的训练。