學(xué)習和關(guān)注人工智能技術(shù)與咨詢,qq群:189696007,更多詳情可咨詢175-3102-1189(v同號)。
多領(lǐng)域發(fā)揮重要作用 知識圖譜本質(zhì)上是基于語義網(wǎng)絡(luò)(semantic network)的知識庫,旨在描述客觀世界的概念、實體、事件及其之間的關(guān)系。 知識圖譜(Knowledge Graph)的概念最先是由谷歌于2012年正式提出,主要用來支撐下一代搜索和在線廣告業(yè)務(wù)。2013年以后知識圖譜開始在學(xué)術(shù)界和業(yè)界普及,并在搜索、智能問答、情報分析、金融等領(lǐng)域應(yīng)用中發(fā)揮重要作用。 生命科學(xué):降低研發(fā)診斷成本 由于研發(fā)新藥花費較高,醫(yī)藥公司非常關(guān)注如何縮短新藥研制周期,降低研發(fā)成本。歐盟第七框架下的開放藥品平臺Open Phacts項目,就是利用來自實驗室的理化數(shù)據(jù)、各種期刊文獻中的研究成果以及各種開放數(shù)據(jù),包括Clinical Trials.org,美國開放數(shù)據(jù)中的臨床實驗數(shù)據(jù),來加速藥物研制中的分子篩選工作,已吸引輝瑞和諾華等制藥巨頭參與。 Watson取得巨大成功之后,IBM成立了Watson group(事業(yè)部),對各種行業(yè)進行認知突破。其中在醫(yī)療方面,IBM啟動了登月計劃(moon shot),通過整合大量醫(yī)療文獻和書籍以及各種EMR(電子病歷)來獲取海量高質(zhì)量的醫(yī)療知識,并基于這些知識向醫(yī)護人員提供輔助臨床決策和用藥安全等方面的應(yīng)用。
金融:識別及預(yù)防欺詐 金融僅次于醫(yī)療,是知識圖譜應(yīng)用最廣泛的領(lǐng)域,在反欺詐、搜索和營銷方面均有深入應(yīng)用。 國外的Datafox和Spiderbook,國內(nèi)的通聯(lián)數(shù)據(jù)等,通過從互聯(lián)網(wǎng)提取上市公司的相關(guān)數(shù)據(jù),包括產(chǎn)品、公司供應(yīng)鏈關(guān)系、競爭對手關(guān)系等,整合為知識圖譜幫助企業(yè)或投資機構(gòu)進行全網(wǎng)數(shù)據(jù)的關(guān)聯(lián)分析、影響傳播和預(yù)測。 反欺詐在金融風控中舉足輕重,但基于大數(shù)據(jù)的反欺詐存在兩個難點:一是如何整合不同來源的結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù),并有效地識別出身份造假、團體欺詐、代辦包裝等欺詐案件。二是不少欺詐案件涉及復(fù)雜的關(guān)系網(wǎng)絡(luò),如組團欺詐。 知識圖譜是基于關(guān)系的表達方式,可輕松解決以上兩個問題,因此在反欺詐中獲得廣泛應(yīng)用。首先,知識圖譜可以提供非常便捷的方式來添加新的數(shù)據(jù)源。其次,知識圖譜本身是直觀的關(guān)系表達方式,可以幫助更有效地分析復(fù)雜關(guān)系中存在的特定的潛在風險。 農(nóng)業(yè):多媒體知識指導(dǎo) 大量的農(nóng)業(yè)資料以不同格式分散存儲,傳統(tǒng)的關(guān)系數(shù)據(jù)庫模式不適用于復(fù)雜多變的領(lǐng)域,無法實現(xiàn)定義所有可能的知識點并構(gòu)建關(guān)鍵數(shù)據(jù)庫模式,而知識圖譜這種更加靈活的知識表示模型可以實現(xiàn)管理。利用抽取挖掘技術(shù)從各種多源異構(gòu)數(shù)據(jù)中獲取相應(yīng)的知識,并用統(tǒng)一圖譜進行表示,形成完整的知識庫,刻畫作物知識、土壤知識、肥料知識、疾病知識和天氣知識等。通過圖譜關(guān)聯(lián)到圖片信息,形成多媒體知識圖譜,病變圖片信息相比專業(yè)知識更加直觀,也更方便農(nóng)民使用。
賦能認知智能 知識圖譜對于人工智能的價值在于讓機器具備了認知能力。機器認知智能在應(yīng)用方面是廣泛、多樣的,體現(xiàn)在精準分析、智慧搜索、智能推薦、智能解釋、更自然的人機交互和深層關(guān)系推理等多個方面。 智能分析 由于缺乏諸如知識圖譜此類背景知識,各類工具理解大數(shù)據(jù)的手段有限,限制了基于大數(shù)據(jù)的精準與精細分析,大大降低了大數(shù)據(jù)的潛在價值。因此盡管越來越多的行業(yè)或者企業(yè)積累了規(guī)模可觀的數(shù)據(jù),但這些數(shù)據(jù)非但未能創(chuàng)造價值,甚至可能因消耗大量的運維成本而成為負資產(chǎn)。 知識圖譜的發(fā)展提供了強大的背景知識支撐,可以賦能輿情分析、商業(yè)洞察、軍事情報分析和商業(yè)情報分析此類基于大數(shù)據(jù)的精準分析。 知識圖譜和基于此的認知智能為精細分析提供了可能。如汽車制造廠商等制造企業(yè)都希望實現(xiàn)個性化制造運用于精細分析案例。知識圖譜構(gòu)建關(guān)于汽車評價的背景知識,如汽車的車型、車飾、動力、能耗等,提取消費者對汽車的褒貶態(tài)度、消費者改進建議、競爭品牌等評價與反饋,并以此為據(jù)實現(xiàn)按需與個性化定制。
自然人機交互 人機交互將會變得更簡單自然。自然人機交互包括自然語言問答、對話、體感交互、表情交互等,需要機器能夠理解人類的自然語言,要求其具有較高認知智能水平及強大的背景知識。會話式(Conversational UI)、問答式(QA)交互將逐步代替?zhèn)鹘y(tǒng)的關(guān)鍵字搜索式交互。未來,Google NOW、siri、amazon Alexa等語音助手及下一代對話機器人將代替我們閱讀、瀏覽,甚至代替我們看電影、電視劇,然后回答我們所關(guān)心的任何問題。 深刻影響社會結(jié)構(gòu) 以深度學(xué)習為代表的人工智能獲得巨大進展,但深度學(xué)習的不透明性、不可解釋性已成為制約其發(fā)展的障礙,“理解”與“解釋”是人工智能需要攻克的下一個挑戰(zhàn),而知識圖譜為“可解釋的人工智能”提供了全新的視角和機遇,并帶來新科技、商業(yè)和社會新紀元—認知時代的黎明。 對于人類而言,知識圖譜賦能人工智能之后,將增強人類的能力,讓我們可以理解和運作社會中復(fù)雜的系統(tǒng),提升我們駕馭科技的能力,改善人類的生存環(huán)境,人類與機器的交互將更加自然、有預(yù)見性、有情感性。
時間:2022年11月11日 — 2022年11月15日 線上直播
目標:緊密結(jié)合理論與實踐,深入淺出,循序漸進。從基本概念講起,重點講解構(gòu)建方法和技術(shù)的轉(zhuǎn)化思路,幫助學(xué)員系統(tǒng)性的掌握知識圖譜的核心技術(shù)原理。基于百科知識進行各項核心技術(shù)的實例訓(xùn)練,并結(jié)合數(shù)字圖書館、醫(yī)療、金融、電商、農(nóng)業(yè)、法律等行業(yè)應(yīng)用幫助學(xué)員快速積累知識圖譜工程項目經(jīng)驗。
具體安排: 一、知識圖譜概論 1.1知識圖譜的起源和歷史 1.2知識圖譜的發(fā)展史——從框架、本體論、語義網(wǎng)、鏈接數(shù)據(jù)到知識圖譜 1.3知識圖譜的本質(zhì)和價值 1.4知識圖譜VS傳統(tǒng)知識庫VS關(guān)系數(shù)據(jù)庫 1.5經(jīng)典的知識圖譜 1.5.1經(jīng)典的CYC, WordNnet, WikiData, DBpedia, YAGO, NELL等知識庫 1.5.2行業(yè)知識圖譜: Google知識圖譜,微軟實體圖,阿里知識圖譜,醫(yī)學(xué)知識圖譜,基因知識圖譜等知識圖譜項目 二、知識圖譜應(yīng)用 2.1知識圖譜應(yīng)用場景 2.2知識圖譜應(yīng)用簡介 2.2.1知識圖譜在數(shù)字圖書館上的應(yīng)用 2.2.2知識圖譜在國防、情報、公安上的應(yīng)用 2.2.3知識圖譜在金融上的應(yīng)用 2.2.4知識圖譜在電子商務(wù)中的應(yīng)用 2.2.5知識圖譜在農(nóng)業(yè)、醫(yī)學(xué)、法律等領(lǐng)域的應(yīng)用 2.2.6知識圖譜在制造行業(yè)的應(yīng)用 2.2.7知識圖譜在大數(shù)據(jù)融合中的應(yīng)用 2.2.8知識圖譜在人機交互(智能問答)中的應(yīng)用 三、知識表示與知識建模 3.1知識表示概念 3.2 知識表示方法 a.語義網(wǎng)絡(luò) b.產(chǎn)生式規(guī)則 c.框架系統(tǒng) d.描述邏輯 e.本體 f.RDF和RDFS g.OWL和OWL2 Fragments h.SPARQL查詢語言 i.Json-LD、RDFa、HTML5 MicroData等新型知識表示 3.3典型知識庫項目的知識表示 3.4知識建模方法學(xué) 3.5知識表示和知識建模實踐 1.三國演義知識圖譜的表示和建模實踐案例 2.學(xué)術(shù)知識圖譜等 四、知識抽取與挖掘 4.1知識抽取基本問題 a.實體識別 b.關(guān)系抽取 c.事件抽取 4.2數(shù)據(jù)采集和獲取 4.3面向結(jié)構(gòu)化數(shù)據(jù)的知識抽取 a.D2RQ b.R2RML 4.4面向半結(jié)構(gòu)化數(shù)據(jù)的知識抽取 a.基于正則表達式的方法 b.基于包裝器的方法 4.5.面向非結(jié)構(gòu)化數(shù)據(jù)的知識抽取 a.實體識別技術(shù)(基于規(guī)則、機器學(xué)習、深度學(xué)習、半監(jiān)督學(xué)習、預(yù)訓(xùn)練等方法) b.關(guān)系抽取技術(shù)(基于模板、監(jiān)督、遠程監(jiān)督、深度學(xué)習等方法) c.事件抽取技術(shù)(基于規(guī)則、深度學(xué)習、強化學(xué)習等方法) 4.6.知識挖掘 a.實體消歧b.實體鏈接c.類型推斷 d.知識表示學(xué)習 4.7知識抽取上機實踐 A.面向半結(jié)構(gòu)化數(shù)據(jù)的三國演義知識抽取 B.面向文本的三國演義知識抽取 C.人物關(guān)系抽取 五、知識融合 5.1知識融合背景 5.2知識異構(gòu)原因分析 5.3知識融合解決方案分析 5.4.本體對齊基本流程和常用方法 a.基于文本的匹配 b.基于圖結(jié)構(gòu)的匹配 c.基于外部知識庫的匹配 e.不平衡本體匹配 d.跨語言本體匹配 f.弱信息本體匹配 5.5實體匹配基本流程和常用方法 a.基于相似度的實例匹配 b.基于規(guī)則或推理的實體匹配 c.基于機器學(xué)習的實例匹配 d.大規(guī)模知識圖譜的實例匹配 (1)基于分塊的實例匹配 (2)無需分塊的實例匹配 (3)大規(guī)模實例匹配的分布式處理 5.6 知識融合上機實踐 1.百科知識融合 2.OAEI知識融合任務(wù) 六、存儲與檢索 6.1.知識圖譜的存儲與檢索概述 6.2.知識圖譜的存儲 a.基于表結(jié)構(gòu)的存儲 b.基于圖結(jié)構(gòu)的存儲 6.3.知識圖譜的檢索 a.關(guān)系數(shù)據(jù)庫查詢:SQL語言 b數(shù)據(jù)庫查詢:SPARQL語言 6.4.上機實踐案例:利用GraphDB完成知識圖譜的存儲與檢索 七、知識推理 7.1.知識圖譜中的推理技術(shù)概述 7.2.歸納推理:學(xué)習推理規(guī)則 a.歸納邏輯程設(shè)計Øb.關(guān)聯(lián)規(guī)則挖掘 c.路徑排序算法 上機實踐案例:利用AMIE+算法完成Freebase數(shù)據(jù)上的關(guān)聯(lián)規(guī)則挖掘 7.3.演繹推理:推理具體事實 Ø a.馬爾可夫邏輯網(wǎng) b.概率軟邏輯 7.4.基于分布式表示的推理 a.TransE模型及其變種 b.RESCAL模型及其變種 7.5.上機實踐案例:利用分布式知識表示技術(shù)完成Freebase上的鏈接預(yù)測 八、語義搜索 8.1.語義搜索概述 8.2.搜索關(guān)鍵技術(shù) a.索引技術(shù):倒排索引 b.排序算法:BM25及其擴展 8.3.知識圖譜搜索 a.實體搜索 b.關(guān)聯(lián)搜索 8.4.知識可視化 a.摘要技術(shù) 8.5.上機實踐案例:SPARQL搜索 九、知識問答 9.1.知識問答概述 9.2.知識問答基本流程 9.3.相關(guān)測試集:QALD、WebQuestions等 9.4.知識問答關(guān)鍵技術(shù) a.基于模板的方法 b.語義解析 c.基于深度學(xué)習的方法 9.5.上機實踐案例:DeepQA、TemplateQA
|