微软牵手OpenAI劲敌!Mistral最新顶级大模型不再开源
创始人
2025-07-13 08:01:36
0

撰稿丨诺亚

出品 | 51CTO技术栈(微信号:blog51cto)

近日,微软宣布与估值约20亿美元的法国AI独角兽Mistral达成合作伙伴关系。

众所周知,成立于去年5月的Mistral凭借其首个模型Mistral 7B就引起了全球AI界的瞩目。“性能更强,硬件需求更少,开源协议更宽松”的Mistral 7B很快引发热潮,外界也随之将Mistral看成是欧洲的OpenAI。

根据协议,Mistral 的开源和商用语言模型将在微软的Azure AI平台上提供,成为继OpenAI之后第二家在Azure上提供商用语言模型的公司。与OpenAI的合作相似,微软与Mistral的合作也将专注于下一代大型语言模型的开发和部署。

通常情况下,Mistral 的模型都是开源的,但与微软的合作意味着这家初创公司现在可以探索更多商业机会。目前微软和 Mistral 都没有透露投资的具体细节。

但据外媒《金融时报》报道,微软将协助 Mistral 推出其 AI 模型,并将在该初创公司中持有少量(具体未披露)的股权。而这距离微软向OpenAI投资100亿美元仅仅过去一年多。

一、Mistral Large的野心:不再开源,对标GPT-4

与此同时,Mistral 宣布推出一款名为"Mistral Large"的新AI模型。该模型旨在与OpenAI的GPT-4模型竞争。

与Mistral先前的一些模型不同,这款新模型不会采用开源形式。Mistral AI团队表示:“Mistral Large在常用基准测试上取得了优异成绩,使其成为全球范围内通过API普遍可用的第二大模型(仅次于GPT-4)。”

图片图片

此外,Mistral Large的主要优势在于:

1. 卓越的多语言能力。该模型在英语、法语、西班牙语、德语及意大利语上拥有母语般的流利度,能够深入理解各语言的语法结构以及文化背景细节。

2. 其配备的32K令牌上下文窗口使得模型可以从大型文档中精确地检索和记忆信息,对于复杂情境下的文本理解和分析尤为强大。因此可以用来处理涉及多种语言的大型数据集和复杂场景。

3. 准确的指令执行能力使得开发者能够根据需要定制自己的内容审核策略。例如,将其应用于名为“le Chat”的聊天系统级别的内容监管设置中。

4.内置了函数调用功能,结合 la Plateforme 上实施的约束输出模式,这为大规模应用开发与技术栈现代化提供了有力支持。开发者可以利用这一特性高效构建和更新应用程序,并确保其生成的内容符合预设规范与要求。

据介绍,Mistral Large 在 HellaSwag、Arc Challenge 和 MMLU( Massive Multitask Language Understanding)等基准测试中,其性能显著超越了LLaMA 2 70B。

图片图片

除了 Mistral Large,Mistral AI 还推出了专为低延迟工作负载设计的优化模型 Mistral Small。相较于 Mistral 的 8x7B 模型,Mistral Small在保持更低延迟的同时实现了性能超越,为用户提供了介于 Mistral 开源权重版本与旗舰级模型之间的高效解决方案。

为了更好地服务开发者,Mistral AI 对其云端服务端点进行了整合优化,不仅提供了极具吸引力的开源权重端点,还新推出了针对 Mistral Small 和 Mistral Large 的优化模型端点“mistral-small-2402”及“mistral-large-2402”,旨在让使用者能够全面了解不同模型在性能与成本之间的权衡取舍。

此外,Mistral AI 引入了 JSON 格式模式,允许开发人员获取模型输出的结构化且有效的 JSON 数据格式,进一步提升了数据处理的便利性和兼容性。目前,函数调用功能以及 JSON 输出格式仅在 Mistral Small 和 Mistral Large 模型上可用,这使得开发者可以实现更复杂的应用场景交互,例如直接与内部代码、API 或数据库进行联动操作。

二、微软的布局:携手Mistral,重点覆盖三大领域

此外,Mistral 还将推出一款基于 Mistral AI 各种模型打造的新款对话式聊天机器人——Le Chat(法语语义:猫),它将能够通过对话界面与该公司的 AI 模型进行交互。目前,“Le Chat”已进入早期客户的测试阶段,并很快将向企业用户开放。

回顾Mistral的发展史,可谓生猛。去年6月,该公司在欧洲有史以来规模最大的种子轮融资中筹集了1亿500万欧元。而在去年12月,其估值达到了20亿,并获得了4亿5千万欧元的投资。Mistral 也是欧洲主要提供 OpenAI 的 ChatGPT 替代方案的玩家之一,与德国的 Aleph Alpha 和赫尔辛基的 Silo AI 并驾齐驱。

通过这次与微软的战略合作,Mistral能够借助合作伙伴强大的市场渠道和技术支持,加速其 AI 解决方案的商业化进程。

值得一提的是,微软与OpenAI向来关系紧密。在微软此次投资之前,OpenAI经历了一段动荡时期。去年11月17日,OpenAI 董事会突然宣布解雇联合创始人兼首席执行官 Sam Altman,然而仅在几天后,Altman 又回归担任 OpenAI 的首席执行官。在这段动荡期间,微软设法在控制 OpenAI 的非营利性董事会中获得了一个无表决权的观察员席位,这为这家软件巨头提供了更多了解 OpenAI 内部运作的机会,但在重大决策方面依然没有投票权。

微软也深谙“鸡蛋不应放在一个篮子里”的投资之道。此次,微软宣布与 Mistral AI 建立长期合作关系,合作重点主要涵盖超级计算基础设施、市场拓展和人工智能研发三大核心领域。

微软首席执行官纳德拉表示:“我们很高兴宣布与 Mistral AI 达成一项多年期合作,这将进一步强化我们在 Azure 上为客户提供最佳开放模型和基础模型选择的承诺。”

作为合作的一部分,微软将向 Mistral AI 提供 Azure AI 超级计算基础设施的接入权限,以确保其在 AI 训练和推理工作负载方面的卓越性能和可扩展性。

双方的合作旨在通过 Azure AI Studio 和 Azure 机器学习模型目录中的“模型即服务”(MaaS)方式,让客户能够轻松访问 Mistral AI 的高级模型。用户可以利用微软 Azure 消耗承诺(MACC)来购买 Mistral AI 的模型,从而提高全球范围内的可用性。

此外,微软和 Mistral AI 还计划携手探索针对特定客户需求训练定制化模型的可能性,尤其是在欧洲公共部门工作负载方面展开深入合作。

参考链接:

https://thenextweb.com/news/mistral-releases-new-ai-model-partners-microsoft

https://www.theverge.com/2024/2/26/24083510/microsoft-mistral-partnership-deal-azure-ai

https://analyticsindiamag.com/mistrals-le-big-model-beats-googles-gemini-pro-signs-multi-year-deal-with-microsoft/

相关内容

热门资讯

如何允许远程连接到MySQL数... [[277004]]【51CTO.com快译】默认情况下,MySQL服务器仅侦听来自localhos...
如何利用交换机和端口设置来管理... 在网络管理中,总是有些人让管理员头疼。下面我们就将介绍一下一个网管员利用交换机以及端口设置等来进行D...
施耐德电气数据中心整体解决方案... 近日,全球能效管理专家施耐德电气正式启动大型体验活动“能效中国行——2012卡车巡展”,作为该活动的...
Windows恶意软件20年“... 在Windows的早期年代,病毒游走于系统之间,偶尔删除文件(但被删除的文件几乎都是可恢复的),并弹...
20个非常棒的扁平设计免费资源 Apple设备的平面图标PSD免费平板UI 平板UI套件24平图标Freen平板UI套件PSD径向平...
德国电信门户网站可实时显示全球... 德国电信周三推出一个门户网站,直观地实时提供其安装在全球各地的传感器网络检测到的网络攻击状况。该网站...
着眼MAC地址,解救无法享受D... 在安装了DHCP服务器的局域网环境中,每一台工作站在上网之前,都要先从DHCP服务器那里享受到地址动...
为啥国人偏爱 Mybatis,... 关于 SQL 和 ORM 的争论,永远都不会终止,我也一直在思考这个问题。昨天又跟群里的小伙伴进行...