人臉識別技術廣受學術和產業研究機構

2021/01/23
高科技

人臉識別技術廣受學術和產業研究機構 。 全球範圍內, 有眾多知名學術機構在從事人臉識別領域的技術研究, 比較有代表性的人臉識別技術研究機構包括史坦福大學、 加州大學伯克利分校、 美國馬薩諸塞大學、 牛津大學、 多倫多大學、 香港 中文大學、 中科院自動化所、 清華大學等。 

(1)、史坦福大學。 史坦福大學是最早在人臉識別技術上取得突破的研究機構之一 。 由華人科學家李飛飛教授領街的計算機視覺實驗室 , 通過每年度基於 ImageNet 數據庫舉辦的大規模視覺識別挑戰賽 ( ILSVRC) , 極大的促進了人臉識別和計算機視覺技術的發展 。 近期, 斯坦福大學的研究團隊研發出一款人臉跟踪軟件Face2Face, 它可以通過攝像頭捕捉用戶的動作和麵部表情, 然後使用Face2Face 軟件驅動視頻中的目標人物做出一模一樣的動作和表情, 效果極其逼真 。 這項技術使用一種密集光度一致性方法 (dense photometric consistency measure) 來實時跟踪源和目標視頻中的面部表情 。 研究人員們稱 ,由於源素材與被拍攝者之間快速而有效的變形傳遞 , 從而使復制面部表情成為可能 。 由於嘴形與其所說的內容高度匹配 , 因此可以產生非常準確 、 可信的契合 。 

(2)、加州大學伯克利分校。 加州大學伯克利分校是國外人臉識別技術研究的重要發源地 , 早在 2005年就有關於人臉識別相關研究的理論工作 。 其中馬毅 2008 年發表的 Sparsity and Robustness in Face Recognition, 在谷歌學術已獲得 6321 餘次的引用 , 在深度神經網絡被大家廣泛應用之前 , 是主流的人臉識別算法 。 在這篇文章中作者把稀疏表示理論應用到人臉識別這個場景中 , 提出了一個通用分類算法用於人臉識別 。 這個新的框架為人臉識別領域的兩個關鍵課題(特徵項提取和對遮擋的魯棒性)上提供了更好的理論指導。 此外,該實驗室近期在用低維模型處理高維數據、 特徵選擇等理論方向上有一定的產出, 提出了一種新型特徵選擇方法(Conditional Covariance Minimization, CCM) , 該方法基於最小化條件 協方差算子的跡來進行特徵選擇, 取得了較為突出的效果。 

(3)、美國馬薩諸塞大學。 美國馬薩諸塞大學也是國外人臉識別技術研究的重要發源地, 開源了知名的人臉檢測數據庫FDDB 和人臉識別數據集LFWo FDDB 是全世界最具權威的人臉檢測評測平台之一, 其中包含2845 張圖片, 共有5171 個人臉作為測試集。 測試集範圍包括不同姿勢 、 不同分辨率 、 旋轉和遮擋等圖片 , 同時包括灰度圖和彩色圖 , 截止到目前 FDDB 所公佈的評測集仍然代表了目前人臉檢測的世界最高水平 。 馬薩諸塞大學還在 2007 年建立了人臉識別評測數據集 LFW, 用於評測非約束條件下的人臉識別算法性能 , 截至到目前是人臉識別領域使用最廣泛的評測集合 。 該數據集由 13000 多張全世界知名人士互聯網自然場景不同朝向 、 表情和光照環境人臉圖片組成 , 共 5000 多人 , 其中 1680 人有 2 張或 2張以上人臉圖片 。 每張人臉圖片都有其唯一的姓名 ID 和序號加以區分 。  LFW測試正確率 , 代表了人臉識別算法在處理不同種族 、 光線 、 角度 、 遮擋等情況下識別人臉的綜合能力。  (4)、牛津大學。 牛津大學 VGG (視覺幾何)組實驗室從 2015 年開始人臉識別相關研究 ,包括具有影響力的人臉數據庫的發布以及深度人臉識別算法的研究 。 該實驗室2015 年在BMVC 發表的a Deep Face Recognition" 論文在谷歌學術已獲得3600 餘次的引用, 其中發布的VGG-Face 已成為深度人臉識別領域最常用的數據庫之一。2018 年發布了 大規模人臉識別數據VGG — Face2, 是VGG-Face的第二個版本, 包含331 萬圖片, 9131 個ID, 平均圖片數為362.6, 且覆蓋了大範圍的姿態、 年齡和種族等。VGG-  Face2 發布兩年, 已經獲得了800 餘次引用。此外, 該實驗室近期在人臉識別置信度預測、 基於集合的人臉識別等子方向上, 每年產出一定量的學術工作。

(5)  、多倫多大學。加拿大多倫多大學是基於深度學習的人臉識別技術發展的重要推手之一。著名“ 神經網絡之父” Geoffrey Hinton 是該校的代表性學者, 在Hinton 的帶領下,多倫多大學的研究 者將反向傳播(Back Propagation) 算法應用到神經網絡與深度學習, 通過應用這項算法技術, 人臉識別技術的識別性能得到極大提高。近期, 多倫多大學的研究人員在人臉識別隱私保護 技術領域取到了一些新的進展, 開發了一種動態干擾算法來進行人臉隱私保護。這種技術原理基於“ 對抗性訓練” , 通過建立起兩種相互對抗的算法, 當發現某種檢測算法 正在尋找臉部特徵, 干擾算法會自動調整這些特徵, 在照片中產生非常細微的干擾, 通過這些干擾來阻礙整個檢測系統的檢測效果。

(6)、香港中文大學。作為最早投入深度學習技術研發 的華人團隊, 在多年佈局的關鍵技術基礎之上, 香港中文大學教授湯曉鷗率領的團隊迅速取得技術突破。2012 年國際計算視覺與模式識別會議( CVPR ) 上僅有的兩篇深度學習文章均出自 其實驗室;2011-2013 年間在計算機視覺領域兩大頂級會議ICCV 和CVPR 上發表了14 篇深度學習論文, 佔據全世界在這兩個會議上深度學習論文總數( 29 篇)的近一半。他 在2009 年獲得計算機視覺領域兩大最頂尖的國際學術會議之一CVPR最佳論文獎, 這是CVPR 歷史上來自亞洲的論文首次獲獎。(7)、中國中科院自動化所。中科院自動化所是國內領先的 模式識別領域研究機構。多年來, 在人臉識別領域開 展了廣泛的研究 。 自動化所李子青研究員領導的人臉識別研究團隊 ,提出了基於近紅外的人臉識別技術 , 對光照變化影響的處理有較好的效果 ,並將該技術應用於 2008 年北京奧運會安保項目 。 自動化所孫哲南研究員團隊 , 在生成對抗網絡基礎上提出高保真度的姿態不變模型 (High Fidelity Pose Invariant Model, HF — PIM) 來克服人臉識別任務中最為經典的姿態不一致問題 。 實驗結果表明 , 該方法在基準數據集上的表現的視覺效果和定量性能指標都優於目前最好的基於對抗生成網絡的方法 。 此外 , HF-PIM 所支持的生成圖像分辨率也在原有方法的基礎上提升了一倍 。  (8)、清華大學。 清華大學是國內最早從事人臉識別技術研究的研究機構之一 。 清華大學蘇光大教授 , 自 1980 年代就開始了人臉識別技術研究工作 。 蘇教授提出了 1 :1 圖像採樣理論和鄰域圖像並行處理機理論 , 並在 2005 年通過多計算機並行處理技術 , 顯著提高了人臉識別處理的性能 。 這項技術與 2012 年由多倫多大學 Hinton 團隊提出的利用並行計算來提高反向傳播算法的運算效能有異曲同工之妙 。 同時 , 蘇教授團隊提出了最佳二維人臉 、 不同類別的多特徵描述以及MMP — PCA 等一系列人臉識別的理論和方法 。

科技類企業。 在人臉識別技術研究領域 , 眾多科技類企業也起到了至關重要的作用 。 微軟亞洲研究院較早就開始了人臉識別技術研究, 發表了大量優秀的學術論文,2018 年, 微軟亞洲研究院提出的深度學習殘差網絡RESNET, 在研究領域得到了廣泛認可;蘋果公司在 人臉識別技術上進行了深入研究, 自2017 年開始,就在其iphoneX 手機上引入了刷臉解鎖功能;日本電氣(NEC) 公司也是國際上人臉識別技術的先行者之一, 很早就提出 了基於人臉識別技術的公共安全解決方案;中國有“ 人工智能四小龍” 之稱商湯、 曠視、 依圖、 雲從等企業, 在人臉領域, 從學術研究到產業實踐, 都做 了大量的工作, 在復雜場景, 大規模處理等領域, 不斷取得新的成果;中國傳統科技企業百度、 阿里、 騰訊、 平安科技、 海康、 大華等, 也在人臉識別技術領域開展廣泛 深入的研究, 並結合其原有的業務領域的場景, 取得顯著的技術研究成果。