MongoDB已在服务端公共许可证(SSPL)下发布了mongot引擎的源码。mongot是驱动MongoDB搜索和向量搜索功能的核心引擎。分析师表示,此举将帮助自管理版本数据库的开发者更好地规划AI用例的RAG系统,因为源码将提供更多的透明度、可调试性和控制能力。
提升开发者透明度和控制力
通过公开mongot的源码,MongoDB将此前仅在Atlas(数据库托管版本)中提供的不透明服务转变为可检查的组件。SanjMo首席分析师桑吉夫·莫汉表示,这让开发者能够了解文本和向量查询是如何被索引、执行和排序的。
这一转变预计将特别受到构建AI和检索增强生成(RAG)应用团队的欢迎。莫汉补充说,随着系统从试点阶段向生产环境迁移,对搜索行为和故障模式的可见性变得越来越重要。
然而,ISG软件研究执行总监戴维·梅宁格提醒,开发者不应将mongot的源码视为开源软件,尽管它是公开可用的。
梅宁格解释说:"与开源许可证类似,SSPL使开发者能够查看、使用、修改和共享相关源码。但它并不满足开源倡议组织开源定义的所有标准,因为它要求任何将SSPL许可源码整合到向外部方(如客户、合作伙伴)提供服务的产品中的人,必须在SSPL许可下发布其产品的全部源码。"
但The Futurum Group数据和分析实践负责人布拉德利·希敏指出,这并不妨碍开发者使用它来构建供自己使用的应用程序。相反,SSPL是"专门设计"来阻止MongoDB的竞争对手免费获取其代码并作为托管服务销售而不付费的。
降低采用门槛
分析师认为,这一发展可能会降低采用MongoDB产品的门槛。
HyperFRAME Research AI技术栈实践负责人斯蒂芬妮·沃尔特表示:"此前,如果开发者想要完整的MongoDB搜索体验,他们必须使用其托管云服务Atlas。通过发布源码,MongoDB实际上消除了其云服务与自管理/社区版本之间的功能壁垒。"
据The Futurum Group的希敏介绍,开发者现在可以在本地环境中测试引擎,无需互联网连接、信用卡,也不需要启动Atlas云集群。
分析师表示,考虑到数据库市场正朝着整合方向发展,特别是在AI应用和用例方面,MongoDB此举是为了留住开发者。
沃尔特说,通常大多数企业会希望在专门的向量数据库上开始其AI应用开发之旅,但如果开发者能够在MongoDB生态系统内测试、构建和扩展AI系统,他们流失的可能性就会降低。
扩展自动化嵌入功能
除了发布mongot源码外,这家数据库提供商还将其向量搜索中的自动化嵌入功能扩展到了数据库的社区版。
这项功能自动化了生成、存储和更新向量嵌入的过程,降低了开发者设计RAG系统时的复杂性。传统上,开发者需要构建一个管道来创建和管理向量嵌入,特别是对于新摄入的数据。
分析师还认为,在社区版中包含自动化嵌入功能是MongoDB挑战竞争对手数据库提供商(特别是专业向量数据库)的更广泛努力中的又一步。
沃尔特表示:"这是对Pinecone的直接打击。如果你已经使用的数据库能够为你处理复杂的嵌入管道,那么购买单独的纯向量数据库就没什么理由了。"
除了沃尔特,希敏也认为在社区版中添加自动化嵌入功能的举措也会对LangChain等"粘合代码"供应商造成冲击。
希敏补充说:"这也给专业向量数据库厂商带来压力,迫使他们提供不仅仅是存储的功能。"自动化嵌入功能和mongot目前仍处于预览阶段。
Q&A
Q1:mongot是什么?它有什么作用?
A:mongot是驱动MongoDB搜索和向量搜索功能的核心引擎。MongoDB已在服务端公共许可证下发布了其源码,让开发者能够了解文本和向量查询是如何被索引、执行和排序的,为RAG系统提供更多透明度和控制能力。
Q2:MongoDB发布mongot源码对开发者有什么好处?
A:发布源码消除了MongoDB云服务与自管理版本之间的功能壁垒,开发者可以在本地环境中测试引擎,无需互联网连接或信用卡,也不需要启动Atlas云集群,大大降低了采用门槛和开发复杂性。
Q3:MongoDB的自动化嵌入功能是什么?
A:自动化嵌入功能可以自动化生成、存储和更新向量嵌入的过程,减少了开发者设计RAG系统时的复杂性。传统上开发者需要构建管道来创建和管理向量嵌入,现在这个过程被自动化了,该功能已扩展到社区版。