2025 OceanBase開發者大會：詳解Data×AI戰略，發布首個RAG產品

派財經派財經2025-05-17 11:37 數字產業

螞蟻OceanBase發布首款面向 AI的PowerRAG產品。

升級AI戰略后的OceanBase迎來了首次開發者大會。5月17日在OceanBase第三屆開發者大會上，OceanBase發布面向AI的應用產品PowerRAG，該產品提供開箱即用的RAG應用開發能力，是OceanBase面向AI時代的探索之一。作為AI戰略一號位、CTO楊傳輝表示，OceanBase正致力于構建Data×AI能力，面向AI時代推動一體化數據庫向一體化數據底座的戰略演進。此前，CEO楊冰曾通過全員信宣布公司全面進入AI時代。

螞蟻集團CTO何征宇在大會現場表示，螞蟻集團將支持OceanBase在金融、醫療、生活等螞蟻AI的核心場景的突破，支持OceanBase去實踐DataxAI的理念和架構創新。同時繼續支持OceanBase開源開放，把在Data×AI上的能力逐漸開放給行業，為AGI的夢想添磚加瓦。

從一體化數據庫向一體化數據底座演進

AI時代帶來了新的數據難題，已成為行業共識。IDC報告指出，受生成式AI等技術驅動，預計2028年全球新生成數據量規模將達到393.9ZB，其中企業數據規模和增速尤為凸顯。于企業而言，數據倉庫的容量已實現質的飛躍，結構化數據存儲規模“突破PB級邁向EB級”成為新常態，這給數據存儲、管理與分析帶來嚴峻挑戰。

螞蟻集團CTO何征宇也在分享中指出，海量的互聯網數據成就了今天的大模型，但大模型幻覺問題的源頭也是數據問題。數據決定著大模型的能力上限，且依舊有四大挑戰：一是數據的獲取成本顯著增加，二是嚴謹的行業數據稀缺且流動困難，三是多模態數據需要更強的處理能力，四是數據的質量評估難。

面對行業的真實需求，OceanBase正在大膽探索。楊傳輝認為，作為一個一體化分布式數據庫，OceanBase已經具備了一定的AI時代數據處理能力，如分布式有效應對海量數據的存儲計算、多模融合統一處理不同結構數據、TP/AP一體化實現混合事務和實時分析處理。但大模型落地產生價值的核心在于數據與模型的一體化融合，這也是OceanBase提出的構建Data×AI能力的關鍵。

基于這一能力，OceanBase致力于從一個一體化數據庫向一個一體化數據底座演進，通過一套引擎同時支持TP/AP/AI混合負載，支持向量數據庫，實現SQL與AI的混合檢索，這背后涉及OceanBase在Data與AI領域的工程與產品能力。

PowerRAG發布，提供開箱即用的RAG應用開發能力

在楊傳輝描繪的一體化數據底座版圖中，OceanBase期望在未來實現從算力、基礎設施，到平臺層、應用層、交付形態的全方位布局。

此次大會上，OceanBase首次發布面向AI的應用產品PowerRAG，打造AI驅動的開箱即用的RAG服務。

楊傳輝介紹，傳統RAG應用常用開發模式包括組件森林開發模式、RAG平臺模式等，但存在開發周期長、維護成本高、灰箱調試困難、性能難以優化等問題。

OceanBase PowerRAG提供開箱即用的RAG應用開發能力，打通應用開發數據層、平臺層、接口層與應用層的全流程，提供Document（文檔）和 Chat（對話）兩個核心API接口，幫助用戶實現文檔知識庫、智能對話、圖像比對、數據分析等多種AI應用場景的快速開發。

“致力于成為AI時代的一體化數據底座，PowerRAG是OceanBase在應用層面探索的第一步，未來還將在應用層面、平臺層面不斷突破。”楊傳輝表示。

據了解，過去十五年OceanBase誕生于雙11的海量交易場景并在螞蟻集團的金融場景中經受磨礪打磨技術，未來，螞蟻集團也將繼續向OceanBase開放核心AI場景，幫助OceanBase進一步攻堅AI關鍵能力，實現開放開源，為行業提供更多的AI創新服務。

向量性能已達開源向量數據庫業內的領先水平

作為原生分布式數據庫，OceanBase原本就具有的企業級分布式數據庫能力為AI時代的海量數據處理分析打下基礎。在支持AI應用落地的核心基礎設施——向量性能、混合檢索等層面，OceanBase也在持續探索，進一步加強SQL+AI能力。

大會現場，基于基準測試工具VectorDBBench，采用Performamce768D1M測試數據集，OceanBase與業內三款領先的開源向量數據庫進行性能跑分測試。結果顯示，OceanBase的向量性能已經達到開源向量數據庫業內的領先水平。

面對AI時代的海量數據，OceanBase還引入BQ量化算法（HNSW+BQ），大幅降低向量場景的內存需求；引入針對JSON半結構化數據的壓縮能力，降低AI場景中的半結構化數據存儲成本。根據測試結果，在同等召回率與性能的情況下，引入BQ量化算法能夠實現內存成本較引入前降低 95%，而在TPC-H 10G數據集上，OceanBase的JSON壓縮比可達 MongoDB 的3倍。

此外，OceanBase已具備面向多種數據模型的混合檢索能力。在最新版本中，OceanBase混合檢索性能進一步增強，通過豐富的執行策略、自研的向量算法庫、內核級多模混合查詢等實現更快、更準、更易用的混合檢索。

目前，OceanBase已被客戶應用于多個AI相關場景的開發，如聯通軟研院基于OceanBase打造AI助手，in銀泰商業則基于OceanBase打造零售業智能問數平臺等。

附：OceanBase CEO楊冰全員信

各位同學：

今年是OceanBase獨立運營的第二年，也是OceanBase成立的第十五年。

回望過去一年，是OceanBase的關鍵一年。這一年在公司層面，我們成立董事會，正式獨立運營；在商業化層面，我們實現了多個突破：我們堅定地將“專有云”和“公有云”作為發展雙引擎，既抓住歷史機遇攻堅金融政企市場，首批通過國測名單，夯實競爭優勢，也加速推進云業務發展，成為云數據庫領域的獨立廠商第一，此外我們堅定邁向全球化，實現從0到1的組織升級，全面發力出海業務。

這一切成績，都得益于過去十五年的厚積薄發。自2010年誕生以來，OceanBase從無到有，堅持100%根自研，毫無疑問已成為分布式數據庫的標桿。我們堅信，海量數據的時代需要的是一款原生分布式數據庫。OceanBase以攻堅者的姿態、開創者的精神，逐一攻克分布式數據庫所遭遇的穩定性、安全性、高并發性、可擴展性、實時分析和多云等難題，打破世界紀錄、經受真實場景考驗，為市場提供了一款高質量的一體化分布式數據庫產品。

此刻，我們面向未來思考，AI正在成為新的主題，它將重塑一切。誰能更好地解決DATA和AI的融合，實現“DATA×AI”，誰就能成為AI時代的數據底座。OceanBase專注數據處理，無論是我們追求卓越的技術文化，還是我們的分布式能力和一以貫之的“一體化”產品理念都與AI時代的需求不謀而合。OceanBase將全面進入AI時代，我們有信心打造出AI時代最好的數據底座，這是時代賦予我們的機遇和責任！

為全力保障AI戰略的高效落地，經過管理層討論，啟動人才和組織體系升級，迎接AI新機遇。基于此決定：

· CTO楊傳輝擔任AI戰略一號位，全面統籌AI戰略制定和技術產品落地。

· 成立AI平臺與應用部，由楊傳輝Acting，ODC、OAS兩個團隊合并到AI平臺與應用部，蔡飛志、王赫加入該團隊，全力推進“DATA × AI”平臺的搭建與應用開發，該團隊將核心打造RAG、AI平臺、知識庫等能力。

· 在原有OB 底層引擎團隊里，新成立AI引擎組，由席華鋒負責，單海康、黃人煌加入該團隊，聚焦打造AI推理引擎，元啟繼續向韓富晟匯報，原元啟負責的系統組也直接向顏然匯報。

· 感謝螞蟻集團的大力支持，接下來集團將開放全部AI場景給OB，助力OB打造AI時代的數據底座！

至此，我們將形成AI時代從一體化存儲（行存、列存、KV、文檔、向量、倒排）到一體化計算（OLTP、OLAP、NoSQL、向量數據庫、搜索、推理、RAG）的全方位布局，依托螞蟻的豐富應用場景將OceanBase的“DATA×AI”能力打磨成為新的核心競爭力，并逐漸服務外部客戶，打造如分布式技術般的世界級AI數據底座。

近日舉辦的首屆“OceanBase擁抱AI Campaign”收獲了全員的熱情參與，也涌現了各種創意，這是OceanBase這個團隊創新能力的最有力證明，我們鼓勵所有團隊全面擁抱AI，積極儲備人才，一起打造下一個十年的OceanBase！一起創造下一個偉大！

楊冰

OceanBase CEO

2025年4月27日

【本文為合作媒體授權派財經轉載，文章版權歸原作者及原出處所有。文章系作者個人觀點，不代表派財經立場，轉載請聯系原作者及原出處獲得授權。有任何疑問都請聯系（paicaijing314@126.com）。
免責聲明：本網站所有文章僅作為資訊傳播使用，既不代表任何觀點導向，也不構成任何投資建議。】

金融科技