國外創投新聞 | 神經搜索公司「Jina.ai」A輪融資3000萬美元,拓展北美業務
據TechCrunch報道,總部位于柏林的Jina.ai今日宣布完成3000萬美元的A輪融資,由Canaan Partners領投。Jina.ai是一家開源創業公司,該公司利用神經搜索幫助用戶在非結構化數據(包括視頻和圖像)中查找信息。參與本輪融資的有Mango Capital和之前的投資方GGV Capital,SAP.iO和Yunqi Partners。迄今為止,該公司的融資總額已達到3900萬美元。
圖片截自企業官網
Jina.ai首席執行官兼聯合創始人肖涵(與王楠、何冰共同創立了該公司)解釋說,神經搜索背后的理念是使用深度學習神經網絡超越傳統的基于關鍵詞的搜索工具。利用遷移學習和表達學習等相對較新的機器學習技術,該公司的核心Jina框架可以幫助開發人員快速構建針對特定用例的搜索工具。
肖涵解釋說,對于圖像、音頻、視頻或其他內容,他們首先使用深度神經網絡將數據格式轉換為通用表達。在這種情況下,它們主要是一個數學向量(一百維向量)。之后匹配算法不計算有多少字母匹配,而是計算數學距離,也就是這兩個向量之間的向量距離。通過這種方式,人們基本上可以解決各種數據搜索問題或相關性問題。
肖涵認為Jina類似于搜索領域的TensorFlow(TensorFlow是谷歌的開源機器學習框架)。就像TensorFlow或PyTorch定義了人們如何設計AI系統的設計模式一樣,Jina希望定義人們如何構建神經搜索系統,并成為在這個過程中這樣做的事實標準。
但Jina只是Jina.ai的其中一個產品。該公司還提供了Jina Hub,該產品像市場一樣,讓開發者分享和發現以Jina為基礎的的神經搜索應用的基本要素,以及最近推出的Finetuner,是一個可以微調任何深度神經網絡的工具。
圖片截自企業官網
肖涵表示,在過去的18個月里,他們花了很多精力來建立核心基礎設施和這個大型神經搜索大樓的基礎,目前這一部分已經完成了?,F在他們正在慢慢地建造這座大樓的第一層和第二層,并且試圖提供端對端的開發體驗。
該公司表示,目前Jina AI開發者社區約有1000名用戶,有電子游戲開發者使用它在多個游戲編輯器中右鍵自動填充相關游戲資產,也有法律技術初創企業利用該技術,使其聊天機器人能夠利用PDF文檔中的數據提供問答體驗。
自2020年5月發布以來,開源Jina框架已經有近200名外部貢獻者,該公司還圍繞該項目建立了一個活躍的Slack社區。
肖涵表示,做開源的主要原因是速度,他們相信開發的速度是一個軟件項目成功的關鍵因素。很多軟件因為速度趨近于零而消亡。他們正在創建社區,并利用社區收集反饋以快速迭代,這對于像他們這樣的基礎設施軟件來說非常重要。他們需要所有頂級開發者給出關于可用性、易訪問性等方面的反饋,這可以幫助他們迅速改進。
Jina.ai計劃利用新一輪融資將其團隊擴大一倍,特別是要拓展其在北美的業務。有了這個擴大的團隊,公司計劃投資研發,以擴大整個Jina生態系統,并圍繞它推出新的工具和服務。
Canaan Partners的Joydeep Bhattacharyya表示,傳統的文本數據搜索系統無法在這個充斥著圖像、視頻和其他多媒體的世界中工作。Jina AI正在將公司從黑白模式轉變為彩色模式,以一種快速、可變和數據不可知的方式解鎖非結構化數據。神經搜索為改進決策、優化運營甚至創造新的收入來源提供了基礎,這些開源框架的早期應用已經展現出了未來的曙光。