soword科技言
永久公益免费API接口
提供永久免费的API接口,查看更多API接口,如果您有其他免费API资源,请联系我们,造福人类。
提供商务开发:小程序,系统,APP
定制开发,免费评估,免费咨询,价格便宜,售后保障,前往开发服务中心联系开发客服中心
Pinecone是一个用于机器学习的无服务器向量数据库,它留给隐形公司1000万美元的资金

由亚马逊SageMaker背后的团队打造。Wing风投吸引了Wing风投的投资,Wing的创始合伙人和早期的Snowflake投资者Peter Wagner加入了初创公司Pinecone的董事会,并比较了Pinecone对Snowflake的潜在影响。支持当今世界最大零售商之一的关键工作负载。对于一家以前不知名的公司来说,这是一个很好的谱系。Pinecone,一家机器学习云基础设施公司,今天以Wing Venture Capital牵头的1000万美元种子资金离开了隐身公司。那么是什么让Pinecone与众不同,而不是另一个数据库呢?ZDNet找到了Pinecone首席执行官兼创始人、科学家、前美国焊接学会(AWS)理事江户·利伯蒂(Edo Liberty)的消息。

Liberty作为一名科学家接受了培训,他的大部分时间都是作为一名学者,在机器学习和系统方面开发和撰写论文和研究。他在雅虎的机器学习小组工作了7年,在AWS工作了大约3年,建立了AWS的机器学习平台SageMaker。

Liberty于2019年5月成立了Pinecone,以解决他认为能够部署大规模机器学习解决方案的最关键组件之一:向量。对于机器学习实践者来说,这已经说明了很多问题。对世界其他地方来说,自由https://medium.com/technology-nineleaps/vectors-in-machine-learning-b8dbdae53aa0“target=”\u blank“rel=”noopener noreferrer nofollow“data component=”externalLink“>向量是什么以及为什么它们很重要:

“我们习惯于记录在数据库中的数据--如键和值,或图像,音频,文本文档。但是当你使用机器学习模型时,他们不会这样看待世界。他们期望的输入是一个很长的数字列表。这叫做向量。这只是一个数字列表。对人类来说,这是完全不透明和毫无意义的。但对于机器学习模型来说,这正是预期的输入和输出;这就是它们所消耗和创造的。如果你正在大规模地构建和部署机器学习,你将拥有数百万、数千万和数亿个这样的高维向量,这些非常长的数字列表,你必须实时地操作它们”。

Pinecone正在寻址机器学习应用程序的关键问题:在云中按比例存储和操作向量

这就是Pinecone要解决的问题:在云中按比例存储和操作向量。正如Liberty所指出的,使用机器学习的组织已经在努力解决这个问题。那么目前人们是如何处理这个问题的呢?松果带来了什么?

人们做这件事的一种方法是试图像Liberty所说的那样“弯曲管道”:利用现有的基础设施,比如开源框架,让它做一些原本不该做的事情——存储和检索向量。Liberty声称,这样做不仅工作量大,而且效率也不高,这就是为什么组织最终会明白这项工作太多,他们不想在内部完成。

然后,Liberty接着补充说,他们只是为他们想要的应用程序购买了一个黑盒解决方案,比如购物网站上的推荐引擎。但同时,还有一个https://www.zdnet.com/article/dataops-changing-the-world-one-organization-at-a-time/“target=”\u blank“>企业必须朝着数据驱动的方向发展,进行更多的数据科学和机器学习,并拥有自己的数据。

幕后黑手

Pinecone希望帮助解决这个难题,让组织更容易拥有自己的机器学习,而不必构建所有的基础设施。为此,Pinecone构建了三个不同的组件,它们在https://www.pinecone.io/product/“target=”\u blank“rel=”noopener noreferrer nofollow“data component=”externalLink“>自定义-加载-查询-观察生命周期。

核心是vector index,这是一种高度专业化的软件,可以高效地索引高维向量,并能够快速准确地与它们交互。还有一个容器分发平台,它允许Pinecone水平扩展并承受任何工作负载;还有一个云管理系统,它允许Pinecone提供一个简单的API,而不必担心资源问题。

听起来很简单,但某些细节值得强调。首先,并非所有向量都是相同的。有许多方法可以表示现实世界中的实体,例如向量中的文档,还有许多方法https://medium.com/@ODSC/top-7-machine-learning-frameworks-for-2020-7e45164914e1“target=”\u blank“rel=”noopener noreferrer nofollow“data component=”externalLink“>机器学习框架,每个人都有自己的方式来完成这个转变。

Pinecone通过允许用户插入他们的转换模型来解决这个问题,不管是他们培训的还是通用的。Pinecone实时地协调了这一点,并确保在发送文档时,将其转换为一个向量,并对其进行索引或检索。

说到检索,这里有一个要点。Pinecone有自己的查询语言,并且它支持2021年技术趋势回顾,第二部分:人工智能,知识图表,而COVID-19效应

通过图形从数据到知识和人工智能:支持知识经济的技术