(1)我們在探索應用
一、自然語言處理
自然語言處理是我們應用最廣泛的。所以我們除了機器翻譯沒有探索外,其他我們都有涉獵:
1、多輪問答、會話
2、意圖識別、情感分析
3、搜索、推薦
4、摘要、生成、Table2Text
二、語音
語音和自然語言處理比較近。
雖然我們也需要語音識別、語音轉(zhuǎn)文本、文本轉(zhuǎn)語音合成。
但國內(nèi)有科大訊飛這個專業(yè)廠商在,我們就不研究了。
三、視覺
視覺四小龍主要聚焦在:人臉識別了。
而我們?nèi)匀痪劢乖诤妥匀徽Z言處理相近的視覺,那就是OCR。
OCR也分很多應用任務:
1、證照識別
2、單據(jù)票據(jù)識別:包含票據(jù)里的印章彎曲文字識別
3、文檔OCR:如文檔中的復雜表格識別,甚至還有手寫簽名識別
4、自然場景下OCR:如道路標識、門頭、菜單/商品說明
四、應用場景
我們也確定了:社會計算,這一應用主題。
圍繞社會計算:社會化營銷-社會化供應鏈-社會化金融,是我們確定的三大應用場景。
這三大應用場景,我們在2019(社會化營銷)、2020(社會化供應鏈)、2021(社會化金融)也做了許多工作。
(2)我們也在夯實基礎
一、經(jīng)典機器學習
我們在不斷探索:經(jīng)典的概率統(tǒng)計、分類聚類
我們也在不斷探索:時間序列預測、運籌學
二、知識嵌入
我們在不斷探索:知識圖譜/事件圖譜、圖神經(jīng)網(wǎng)絡
我們也在不斷探索:因果推斷、知識推理
三、少數(shù)據(jù)少樣本少訓練
我們在不斷探索:Transformer、骨干網(wǎng)絡結(jié)構(gòu)
我們也在不斷探索:遷移學習、對比學習、強化學習,期盼做到自監(jiān)督、無監(jiān)督
四、多模態(tài)
我們主要在一梭子Transformer橫穿自然語言處理、視覺OCR兩大數(shù)據(jù)和應用領(lǐng)域
當然,我們也在期盼有一梭子的方法,能橫穿中文、英文。我們發(fā)現(xiàn)很多方法對于英文效果很好,但就不適用于中文。
(3)期盼業(yè)界突破
微軟亞洲研究院堪稱是中國人工智能的黃埔軍校。
有擅長人才吸引的:李開復
有擅長理論研究的:沈向洋
有擅長工程實現(xiàn)的:張宏江
有擅長應用場景的:張亞勤
一、數(shù)據(jù)
突破方向有二:
1、突破一:中文?,F(xiàn)在全世界人工智能領(lǐng)域,都是適合英文處理的理論方法、框架工具、數(shù)據(jù)集。中文的太少。
2、突破二:多模態(tài)
主要以北大人才為骨干的、張宏江博士做主力支持的智源研究院,在中文多模態(tài)數(shù)據(jù)集、中文巨模型的建設方面很好。
二、工具
現(xiàn)在滿世界都是適合英文處理的理論方法、框架工具、數(shù)據(jù)集。中文的太少。中國幸好有了百度PaddlePaddle,這是一個適合處理中文的框架工具。
但是對不起,PaddlePaddle還主要在通用平臺級,在應用任務級還有很多的空白、效果短板。
2020年,從微軟亞洲研究院、百度出來的張亞勤,組建清華大學智能產(chǎn)業(yè)研究院(AIR),它的使命是:利用人工智能技術(shù)賦能產(chǎn)業(yè)升級。它主要面向三大應用場景:智能工業(yè)互聯(lián)網(wǎng)、智能交通、智能醫(yī)療。
三、理論
在中文世界,人工智能理論突破性不多。我挺期盼沈向洋的。期盼他在清華大學高等研究院好好沉一沉。而且他作為小冰的董事長,小冰的海量多模態(tài)數(shù)據(jù),也會給他的理論研究工作帶來很好的輔助。

小程序
掃碼打開微信小程序
APP下載
掃碼下載市場部網(wǎng) App




