數(shù)據(jù)洪流正在席卷整個(gè)世界。研究機(jī)構(gòu)Statista預(yù)計(jì),至2025年全球數(shù)據(jù)創(chuàng)建量——即創(chuàng)建、捕獲、復(fù)制和使用的數(shù)據(jù)總量,將超過(guò)180ZB。面對(duì)指數(shù)級(jí)增長(zhǎng)的數(shù)據(jù)規(guī)模和愈發(fā)復(fù)雜的數(shù)據(jù)類(lèi)型,企業(yè)想要從中獲得商業(yè)洞察變得越來(lái)越難。究其原因,是業(yè)務(wù)人員難以從海量數(shù)據(jù)中發(fā)現(xiàn)其關(guān)聯(lián)性,缺乏行之有效的工具,無(wú)法找到真正有價(jià)值的信息來(lái)指導(dǎo)業(yè)務(wù)發(fā)展。此時(shí),就不能不提大數(shù)據(jù)技術(shù)的演進(jìn)。
從Hadoop誕生之日起,大數(shù)據(jù)的發(fā)展走過(guò)了十余年,期間像存儲(chǔ)、離線處理等基礎(chǔ)問(wèn)題已經(jīng)得到了解決。隨著深度學(xué)習(xí)、機(jī)器學(xué)習(xí)等AI技術(shù)的逐級(jí)深入,人們開(kāi)始思考如何通過(guò)挖掘大數(shù)據(jù)的關(guān)聯(lián)性去探索“隱藏”在背后的商業(yè)價(jià)值,這種訴求也將一個(gè)18年前的技術(shù)再次推到了臺(tái)前——圖數(shù)據(jù)庫(kù)。與以往用表格處理數(shù)據(jù)相比,圖沒(méi)有表的概念的,就是數(shù)學(xué)上點(diǎn)和邊的關(guān)系,所有的數(shù)據(jù)可以匯集在一起。
對(duì)于傳統(tǒng)的關(guān)系型數(shù)據(jù)庫(kù)來(lái)說(shuō),雖然其具有靈活的特點(diǎn),可以做各種復(fù)雜計(jì)算,但在大數(shù)據(jù)時(shí)代對(duì)于并行計(jì)算、多機(jī)版的支持是缺乏的,而文檔數(shù)據(jù)庫(kù)、關(guān)鍵字、內(nèi)存數(shù)據(jù)庫(kù),犧牲了業(yè)務(wù)的一些表達(dá)能力,得到的好處就是可擴(kuò)充,但很多以前用關(guān)系型數(shù)據(jù)庫(kù)能表達(dá)的問(wèn)題卻表達(dá)不了。從存儲(chǔ)角度來(lái)說(shuō),圖是存儲(chǔ)數(shù)據(jù)最自然的關(guān)聯(lián)模型。從計(jì)算角度來(lái)說(shuō),則適合數(shù)據(jù)和人工智能。由于早年間計(jì)算性能和架構(gòu)的局限,使得圖數(shù)據(jù)庫(kù)這個(gè)在計(jì)算機(jī)科學(xué)領(lǐng)域較為高階的研究成果在近幾年才開(kāi)始顯露威力。
在Neo4j高級(jí)產(chǎn)品市場(chǎng)總監(jiān)Maya Natarajan博士看來(lái),伴隨數(shù)據(jù)量猛增而帶來(lái)的則是數(shù)據(jù)更加復(fù)雜且高度關(guān)聯(lián),關(guān)系型數(shù)據(jù)庫(kù)已無(wú)法滿足處理復(fù)雜關(guān)聯(lián)數(shù)據(jù)的需求,不能使客戶(hù)從數(shù)據(jù)中完全受益。相比之下,圖數(shù)據(jù)庫(kù)是專(zhuān)為存儲(chǔ)和分析高度關(guān)聯(lián)數(shù)據(jù)而生的,“隨著人工智能的發(fā)展和大數(shù)據(jù)時(shí)代的到來(lái),并行計(jì)算類(lèi)的處理需求增加,圖數(shù)據(jù)庫(kù)客戶(hù)反饋,圖在關(guān)聯(lián)模型方面具有更大的優(yōu)勢(shì),更具有前瞻性,可以更加充分地利用關(guān)聯(lián)數(shù)據(jù)并發(fā)掘他們的價(jià)值。”
Neo4j高級(jí)產(chǎn)品市場(chǎng)總監(jiān)Maya Natarajan博士
事實(shí)上,近年來(lái)的數(shù)據(jù)庫(kù)領(lǐng)域正在經(jīng)歷融合式的創(chuàng)新,文檔數(shù)據(jù)庫(kù)、圖數(shù)據(jù)庫(kù)、時(shí)序數(shù)據(jù)庫(kù)、NoSQL 逐漸成為主流。與此同時(shí),數(shù)據(jù)庫(kù)也越來(lái)越多地融入了云計(jì)算、AI/ML等技術(shù)。擁有13年歷史的瑞典企業(yè)Neo4j是圖技術(shù)的開(kāi)創(chuàng)者,也是原生圖數(shù)據(jù)庫(kù)市場(chǎng)的領(lǐng)導(dǎo)者。Neo4j的產(chǎn)品有社區(qū)版和企業(yè)版,服務(wù)著全球超過(guò)1000家企業(yè)客戶(hù)。過(guò)去十年,Neo4j從圖數(shù)據(jù)庫(kù)逐步演變成為圖數(shù)據(jù)平臺(tái)。與傳統(tǒng)的圖數(shù)據(jù)庫(kù)不同,圖數(shù)據(jù)平臺(tái)整合了數(shù)據(jù)科學(xué)、人工智能,機(jī)器學(xué)習(xí),充實(shí)和擴(kuò)大了解決方案的功能。
Gartner預(yù)測(cè),2012年至2022年,全球圖處理及圖數(shù)據(jù)庫(kù)的應(yīng)用將以每年100%的速度迅猛增長(zhǎng)。DB Engines近七年數(shù)據(jù)庫(kù)流行趨勢(shì)也顯示,圖數(shù)據(jù)庫(kù)相較其他主流數(shù)據(jù)庫(kù)受歡迎程度遙遙領(lǐng)先。在圖數(shù)據(jù)庫(kù)高速發(fā)展的浪潮之中,知識(shí)圖譜的重要性不言而喻。根據(jù)IDC亞太數(shù)據(jù)和內(nèi)容技術(shù)2022年預(yù)測(cè)報(bào)告,到2025年亞太地區(qū)2000家企業(yè)中約有30%將部署圖數(shù)據(jù)庫(kù)。到2023年,亞太地區(qū)20%的商業(yè)智能將整合知識(shí)圖譜。
另?yè)?jù)Neo4j一項(xiàng)針對(duì)100名企業(yè)高管的相關(guān)調(diào)查顯示,88%的企業(yè)管理者已經(jīng)認(rèn)識(shí)到知識(shí)圖譜的價(jià)值,認(rèn)為知識(shí)圖譜可以幫助跨越管理和數(shù)據(jù)治理的瓶頸,在彌合數(shù)據(jù)孤島,改進(jìn)AI或者機(jī)器學(xué)習(xí),以及協(xié)助開(kāi)辟新收入來(lái)源等方面發(fā)揮重要作用。到2023年80%的數(shù)據(jù)和分析創(chuàng)新項(xiàng)目將使用圖數(shù)據(jù)庫(kù)來(lái)實(shí)現(xiàn),而2021年只有10%的創(chuàng)新項(xiàng)目是使用圖數(shù)據(jù)庫(kù)。
阿蘭·圖靈研究所將知識(shí)圖譜定義為“對(duì)知識(shí)進(jìn)行編碼以在開(kāi)放、不斷發(fā)展、去中心化系統(tǒng)中大規(guī)模使用”的最佳方式。簡(jiǎn)而言之,知識(shí)圖譜是具有豐富含義、相互關(guān)聯(lián)的數(shù)據(jù)集。企業(yè)可以針對(duì)基礎(chǔ)數(shù)據(jù)進(jìn)行推理,并且自信地將其用于復(fù)雜的分析和決策中。
Maya Natarajan認(rèn)為,知識(shí)圖譜有三方面價(jià)值:第一、知識(shí)圖譜可以將數(shù)據(jù)轉(zhuǎn)化為智能,使企業(yè)更好地管理人工智能和機(jī)器學(xué)習(xí);第二,知識(shí)圖譜能幫助企業(yè)在不改變現(xiàn)有數(shù)據(jù)格局和基礎(chǔ)設(shè)施的前提下,進(jìn)行數(shù)據(jù)編排和自動(dòng)化,為管理者提供連續(xù)觀察層,優(yōu)化數(shù)據(jù)管理、數(shù)據(jù)預(yù)測(cè)和數(shù)據(jù)創(chuàng)新,加速企業(yè)數(shù)字化轉(zhuǎn)型;第三,知識(shí)圖譜能夠幫助企業(yè)開(kāi)創(chuàng)新的收入來(lái)源,提高業(yè)務(wù)效率,應(yīng)用場(chǎng)景分布在金融、制造、零售、電信、互聯(lián)網(wǎng)等多個(gè)行業(yè)。
據(jù)了解,Neo4j知識(shí)圖譜包含數(shù)據(jù)、顯示動(dòng)態(tài)內(nèi)容的圖數(shù)據(jù)及語(yǔ)義在內(nèi)的三大要素。與關(guān)系型數(shù)據(jù)庫(kù)的平面結(jié)構(gòu)不同,當(dāng)數(shù)據(jù)被抽取到Neo4j動(dòng)態(tài)圖結(jié)構(gòu)中存儲(chǔ)時(shí),節(jié)點(diǎn)和節(jié)點(diǎn)之間的關(guān)系就被添加進(jìn)來(lái),為數(shù)據(jù)提供了動(dòng)態(tài)的內(nèi)容,即第一層上下文關(guān)系。而隨著信息不斷豐富,圖也會(huì)不斷增長(zhǎng)。在圖中獲取數(shù)據(jù)并為它添加語(yǔ)義,就獲得一個(gè)知識(shí)圖。語(yǔ)義為圖添加了第二層上下文關(guān)系,圖譜就具備了深入動(dòng)態(tài)的上下文關(guān)系。通過(guò)這個(gè)步驟將智能引入到數(shù)據(jù)當(dāng)中,便于系統(tǒng)或者客戶(hù)從中推斷出不同的含義。
根據(jù)數(shù)據(jù)范圍,Neo4j知識(shí)圖譜的應(yīng)用范疇劃分為數(shù)據(jù)管理和數(shù)據(jù)分析。數(shù)據(jù)管理包括匯集、校驗(yàn)、治理和探索數(shù)據(jù)。而數(shù)據(jù)分析側(cè)重推理、預(yù)測(cè)判定。相對(duì)應(yīng)的,Neo4j提供行為圖和決策圖兩種類(lèi)型的知識(shí)圖譜,協(xié)助客戶(hù)從行為知識(shí)圖譜過(guò)渡到?jīng)Q策知識(shí)圖譜,實(shí)現(xiàn)數(shù)據(jù)分析到數(shù)據(jù)智能,完成數(shù)據(jù)創(chuàng)新。
Maya Natarajan介紹稱(chēng),行為知識(shí)圖譜是以數(shù)據(jù)管理為核心的知識(shí)圖譜,其主要目的是提供數(shù)據(jù)保障,并通過(guò)數(shù)據(jù)洞察來(lái)推動(dòng)決策行動(dòng)。其中,數(shù)據(jù)保障側(cè)重把不同數(shù)據(jù)源的數(shù)據(jù)聚合在一起,進(jìn)行數(shù)據(jù)交叉驗(yàn)證從而產(chǎn)生洞察,數(shù)據(jù)治理包括如何溯源數(shù)據(jù)目錄和結(jié)構(gòu),數(shù)據(jù)是否存在血緣關(guān)系以及是否合規(guī),以甄別存在的風(fēng)險(xiǎn)。數(shù)據(jù)洞察專(zhuān)注于新知識(shí)的探索、演繹和推理,主要用例包括客戶(hù)360、產(chǎn)品360、供應(yīng)鏈360,以及身份驗(yàn)證、客戶(hù)計(jì)劃等。決策知識(shí)圖譜側(cè)重于數(shù)據(jù)分析、預(yù)測(cè)判定和基礎(chǔ)圖的機(jī)器學(xué)習(xí),主要用例包括流失分析、欺詐分析、風(fēng)險(xiǎn)分析、假設(shè)分析和影響分析以及實(shí)體解析和知識(shí)圖譜補(bǔ)全和預(yù)測(cè)模型等,例如醫(yī)療行業(yè)的患者旅程分析、制造行業(yè)的數(shù)字孿生等。
Neo4j知識(shí)圖譜解決方案是一個(gè)知識(shí)圖譜平臺(tái),建立在豐富的產(chǎn)品基礎(chǔ)上,包括負(fù)責(zé)數(shù)據(jù)存儲(chǔ)的Neo4j圖數(shù)據(jù)庫(kù),幫助建模的知識(shí)圖譜工作臺(tái),致力數(shù)據(jù)分析的圖數(shù)據(jù)科學(xué)(GDS)和數(shù)據(jù)可視化工具Neo4j Bloom。作為原生的圖數(shù)據(jù)平臺(tái),Neo4j專(zhuān)注于處理高度復(fù)雜且具有高度關(guān)聯(lián)的數(shù)據(jù),擁有超過(guò)60個(gè)圖數(shù)據(jù)算法,并且可以連接各類(lèi)外部平臺(tái),便于用戶(hù)更充分地進(jìn)行數(shù)據(jù)分析。
美國(guó)國(guó)家航空航天局利用Neo4j處理了大量的工程項(xiàng)目和文檔資料數(shù)據(jù),工程師可以通過(guò)學(xué)習(xí)項(xiàng)目知識(shí)來(lái)提高業(yè)務(wù)決策效率,數(shù)據(jù)的關(guān)聯(lián)性使得查詢(xún)搜索過(guò)程大幅加快;中國(guó)一家全球最大的通訊設(shè)備供應(yīng)商擁有超過(guò)600個(gè)數(shù)據(jù)庫(kù),將這些數(shù)據(jù)抽取到Neo4j數(shù)據(jù)平臺(tái),數(shù)據(jù)量超過(guò)500億節(jié)點(diǎn)和800億關(guān)聯(lián),將知識(shí)圖譜優(yōu)化之后,客戶(hù)實(shí)現(xiàn)了全面的產(chǎn)品360視圖,大幅減少了查詢(xún)時(shí)間,使產(chǎn)品團(tuán)隊(duì)得以進(jìn)行更高級(jí)和深入的數(shù)據(jù)分析;中國(guó)某家大型銀行使用Neo4j知識(shí)圖譜進(jìn)行配置管理,支持靈活建模,提高了客戶(hù)效率,讓配置管理更加自動(dòng)化;全球知名PC供應(yīng)商基于Neo4j圖數(shù)據(jù)庫(kù),對(duì)營(yíng)銷(xiāo)和銷(xiāo)售各關(guān)鍵要素的關(guān)系進(jìn)行了深入挖掘,并支持了多場(chǎng)景的實(shí)踐,幫助業(yè)務(wù)實(shí)現(xiàn)效率與效果的提升。
類(lèi)似的案例還發(fā)生在eBay、UBS、思科、Caterpillar、AstraZeneca等企業(yè)。Neo4j所有的圖數(shù)據(jù)科學(xué)項(xiàng)目都始于知識(shí)圖譜,其67%的客戶(hù)已經(jīng)成功地實(shí)施了知識(shí)圖譜。除此之外,Neo4j的成功也離不開(kāi)對(duì)開(kāi)發(fā)者生態(tài)的建設(shè)。目前,Neo4j的社區(qū)在全球擁有25萬(wàn)名成員,并且多數(shù)分布在中國(guó)。自2018年起,Neo4j就開(kāi)始活躍在中國(guó)市場(chǎng),業(yè)務(wù)足跡遍布北京、上海、廣州、深圳,并與業(yè)內(nèi)合作伙伴建立了良好的關(guān)系。今年,Neo4j將在大中華區(qū)開(kāi)展更多的推廣活動(dòng),提供更加本地化的資料,為社區(qū)成員提供更多的培訓(xùn),幫助其獲得Neo4j的免費(fèi)認(rèn)證。在產(chǎn)品研發(fā)上繼續(xù)加大投入,持續(xù)優(yōu)化產(chǎn)品,使其更加便于使用。
去年6月,Neo4j在F輪風(fēng)險(xiǎn)投資中獲得3.25億美元的融資,創(chuàng)造了私營(yíng)數(shù)據(jù)庫(kù)公司單筆最高融資紀(jì)錄,投后估值超過(guò)20億美元。除了繼續(xù)投資圖數(shù)據(jù)平臺(tái)和數(shù)據(jù)科學(xué)之外,Neo4j還會(huì)重點(diǎn)擴(kuò)展中國(guó)市場(chǎng),幫助越來(lái)越多的中國(guó)企業(yè)通過(guò)圖數(shù)據(jù)平臺(tái)來(lái)挖掘數(shù)據(jù)的價(jià)值。“Neo4j的企業(yè)愿景就是在不同的行業(yè)場(chǎng)景,幫助客戶(hù)深入分析高度關(guān)聯(lián)的復(fù)雜數(shù)據(jù),使業(yè)務(wù)數(shù)據(jù)變?yōu)樯虡I(yè)智能,提高數(shù)據(jù)的應(yīng)用價(jià)值,加速企業(yè)數(shù)字化進(jìn)程?!盡aya Natarajan說(shuō)。
戴爾易安信PowerEdge R340 機(jī)架式服務(wù)器(Xeon E-2224/16GB/4TB*2)
領(lǐng)券滿15000減511
進(jìn)入購(gòu)買(mǎi)
聯(lián)想ThinkSystem SR850(Xeon Gold 5218*2/32GB/1.2TB*4)
領(lǐng)券滿50000減1000贈(zèng)
進(jìn)入購(gòu)買(mǎi)
浪潮NF2180M3(FT2000+/32GB*8/960GB*2+12TB*4/9361-8i)
進(jìn)入購(gòu)買(mǎi)
關(guān)鍵詞: 圖數(shù)據(jù)庫(kù) 知識(shí)圖譜
關(guān)于我們 廣告服務(wù) 手機(jī)版 投訴文章:39 60 2 914 2@qq.com
Copyright (C) 1999-2020 www.tkjt8.cn 愛(ài)好者日?qǐng)?bào)網(wǎng) 版權(quán)所有 聯(lián)系網(wǎng)站:39 60 2 914 2@qq.com