2024年7月,胡國平在北京接受《環(huán)球人物》記者采訪。(楊皓 攝)
胡國平,1977年出生于安徽省績溪縣,1995年考入中國科學技術大學計算機系,2007年獲工學博士學位??拼笥嶏w股份有限公司聯合創(chuàng)始人,現任認知智能全國重點實驗室主任、科大訊飛高級副總裁。
“劉德華為什么很少演反派?”
2023年9月,這個網絡提問突然在各大社交平臺火了,但火的不是關于演員的討論,而是問題下面“驢唇不對馬嘴”的回復,竟然是抨擊謾罵中國科技公司華為的內容。
原來,“劉德華”和“為什么”兩個詞組的搭配,觸發(fā)了境外某些網絡人工智能(AI)識別出“華為”這個關鍵詞,被輸入過相關指令的AI水軍蜂擁而至,大肆攻擊華為,結果反而暴露了幕后操控者。
“通過這件事,我們可以判斷出境外AI的中文水平不如國內。”認知智能全國重點實驗室主任胡國平對《環(huán)球人物》記者說,“國內AI是不會犯這種低級錯誤的,因為我們擁有海量的中文語料,足以讓AI正確識別詞組和詞意,而境外的中文大數據不夠多,機器學習得不夠深。”
被“卡脖子”之后
胡國平已經在智能語音領域深耕了20多年,他的另一個身份是科大訊飛聯合創(chuàng)始人、高級副總裁。“要提高AI水平,必須有足夠的文本和題型‘訓練’機器,就像學生刷題一樣,才能讓它少犯錯誤。如果中國的互聯網沒有發(fā)達到一定程度,國內AI不可能發(fā)展得這么快。”
這種速度也招來了外部打壓。與眾多中國高科技企業(yè)一樣,2019年10月,科大訊飛被美國列入出口管制“實體名單”,被限制從美國購買零部件。“比如小語種的語音合成軟件,以前我們可以用美國的,但被列入‘實體名單’后,突然就斷供了。我們必須在短時間內開發(fā)出替代產品。”胡國平對記者說。
2024年巴黎奧運會期間,中國記者(左)手持訊飛翻譯機采訪外國友人。
被“卡脖子”的之所以是小語種,是因為我國的中文語音技術已經領先全球,英文等大語種也沒問題。但小語種文本數據少,投入產出比不高,開發(fā)難度相對較大。
胡國平坦言,疫情防控期間是研發(fā)團隊比較痛苦的階段,因為需要到海外搜集小語種數據,請人錄音,“突然這個人得新冠了,不能繼續(xù)錄了,我們就要另外找人”。
3年時間里,在中國科學院的支持下,研發(fā)團隊克服了重重困難,突破了60個小語種的技術障礙。
同一時期,美國的科技公司正在進軍大模型賽道。2022年11月,美國OpenAI公司發(fā)布了一款智能聊天機器人ChatGPT,引發(fā)全球轟動。在此之前,科大訊飛一直關注著ChatGPT的發(fā)展,其早期版本并不突出,但隨著訓練方法、超大模型和海量文本數據的結合,這款產品的智能水平飛速提升。
2024年6月,星火大模型V4.0發(fā)布。
2022年12月,科大訊飛決定研發(fā)“星火大模型”,胡國平擔任項目攻關負責人,一場新的戰(zhàn)役正式打響。之所以取名“星火”,既有照亮前路之意,也有“率先燎原”的期待,更代表著力量、勇氣和堅韌不拔的精神。經過全力攻關,2023年5月,訊飛星火大模型正式發(fā)布,之后不斷升級,目前已到第四代版本。
“我們去年打了一場硬仗。”胡國平說。為了大模型算力集群能盡快落地,團隊夜以繼日地工作,頂著三伏天的高溫進行機房改造。因為機房里沒有空調,大家只能帶冰塊進去物理降溫。之后的中秋節(jié)、國慶節(jié),團隊都沒放假。2023年10月,首個國產萬卡智能算力集群“飛星一號”正式啟動。
“我們?yōu)槭裁磿?lsquo;卡脖子’?因為用外國產品用慣了,缺乏改變的動力??萍几偁幉粌H限于產品、企業(yè),更是產業(yè)生態(tài)的競爭。美國的打壓客觀上給了中國發(fā)展自主生態(tài)的好機會。只有當你足夠強大的時候,西方才會跟你和平共處,所以我們一定要扛過去。”
夢想萌發(fā)地
胡國平很少談及家庭,但他坦言,自己受父親影響非常大。“我父親上學時成績優(yōu)異,在我們縣一直是前三名,比他成績差的都上了清華北大,但因為出身問題,他沒能上大學。”在老家務農15年后,胡國平的父親成了一名民辦代課教師,先教小學,后教初中,轉為公辦教師后,又開始教高中。
“現在他已經81歲了,但每年高考試卷出來后,還會做一遍高考題。”在胡國平眼中,父親是一個很純粹的人,“我特別敬佩我爸,他既能教數學,干農活又非常拿手”。
胡國平從小喜歡理科,上中學時成績也在縣里排前三名,父親對他說“你一定要考一本”,他從此記住了“一本”這個詞。
1995年,高考后填志愿,胡國平的成績可以上清華北大,但他最終選擇了中國科技大學(以下簡稱中科大)。“我們那里是個小縣城,之前已經十幾年沒有學生考上清華北大了。我爸跟別人咨詢后,覺得中科大的計算機專業(yè)好,離家又近。而且他當年報考的就是中科大,我考上也算圓了他的夢。”
上世紀90年代的中國,物質條件還比較匱乏,胡國平上中學之前沒有出過績溪縣,高中畢業(yè)時沒有出過安徽省。盡管中科大就在省會合肥,但從績溪到合肥,他反而要出省——先坐火車到江蘇南京,轉車到安徽蚌埠,再轉車到合肥。
走進大學校門,胡國平接觸到許多“高人”和“牛人”,學習也變得更加主動。除了經常去自習室外,他還跟同學一起湊錢,買了一臺486電腦,開始練習編程。
“那臺電腦要9000多元,我們寢室6個人,每人湊1000多。當時每月生活費也就幾百元,不夠的只能跟家里要,再加上一些獎學金。”
讀大三時,胡國平在老師的推薦下,進入中科大電子系教授王仁華的實驗室,參與語音識別與合成技術的研發(fā)。“通俗地說,語音識別就是讓計算機聽懂人說的話,語音合成就是讓計算機開口說話,相當于耳朵和嘴的關系。其中的關鍵在于分辨詞組和多音字,比如‘輕舟已過萬重山’,‘重’是多音字,我們要做的就是合成信號,讓計算機知道該讀什么音。”胡國平說。
當時,包括中文語音在內的技術主要掌握在IBM、東芝等美日企業(yè)手中,中國企業(yè)的電子產品如果想加上語音功能,只能找外國廠商購買。“其實我們的技術并不比西方落后,甚至還有領先之處,但因為形不成產業(yè)生態(tài),技術無法落地,國內企業(yè)就被西方卡著脖子走。王仁華老師是中國AI領域的先驅和開拓者,他最大的心愿就是讓中文語音技術掌握在中國人自己手里。”
在課題組,胡國平認識了比自己高五屆的安徽老鄉(xiāng)劉慶峰。劉慶峰本來可以保送清華大學汽車工程系,因為更心儀中科大,放棄了保送,以超過清華錄取線40多分的成績考入中科大電子系。大二時,他就被王仁華選入語音實驗室,之后做出了多項關鍵技術創(chuàng)新。
1998年夏天,為了改變技術與產業(yè)脫節(jié)的局面,正在攻讀博士的劉慶峰向王仁華提出創(chuàng)立一家公司,走技術產業(yè)化的道路。王仁華欣然同意,實驗室的師兄弟們也紛紛響應,中科大網絡論壇8個版主中的6個加盟進來,每個都是“學霸”級人物,最終組成了一支18人的創(chuàng)業(yè)團隊,胡國平是其中之一。
“甘坐十年冷板凳”
創(chuàng)業(yè)之初,為了專心搞研發(fā),團隊將公司運營外包給了另一家企業(yè),相當于對方設在合肥的研發(fā)基地。然而合作方毫無章法,今天要求團隊做個語音聽寫軟件,明天又要搞工商查詢系統(tǒng),結果產品做了不少,卻沒有一個做深做透,也賣不出去,團隊疲憊不堪。
大半年后,成員們忍無可忍,集體對劉慶峰說:“要不你當GEO,要不我們就解散!”本來只想搞研發(fā)的劉慶峰,硬著頭皮同意了。1999年,科大訊飛公司正式誕生。
“那時的我們就是一幫窮學生,只會悶頭研發(fā)技術,什么市場、營銷、品牌都不懂。”胡國平回憶道,“公司成立的最初三四年,我們以為有了好產品就能掙錢,想得太簡單了。”
他們做出了一款名叫“暢言2000”的電腦軟件,能把語音自動轉換成文字,還可以通過語音控制電腦。推向市場后,受到很多老年人的喜愛,因為他們不太會操作電腦、打字很慢。但產品還是賠錢,原因非?,F實:一是當時盜版猖獗,正版軟件一面世,盜版已經鋪天蓋地;二是老年用戶經常需要售后服務,推高了成本,團隊跑兩三次售后,賣軟件的利潤就沒了;三是大家都不懂營銷,產品賣不出去。
經過幾次挫折,公司始終未能真正打開市場,資金鏈幾近斷裂,最困難時賬上只剩20萬元。一些團隊成員是放棄了出國留學的機會和外企高薪,拿著兩三千元月薪加盟的。拼命努力卻在短期內看不到結果,軍心開始動搖。有人質疑:語音產業(yè)到底能不能做大?有人提議,既然語音業(yè)務賺不了錢,不如改做網絡游戲甚至房地產,賺點快錢。
為了統(tǒng)一內部想法,劉慶峰將團隊拉到合肥巢湖邊上的半湯開了一次會。聽大家七嘴八舌地說完意見,他只說了一句話:“如果不看好語音的前景,請走人!”全場立刻鴉雀無聲。
“對公司來說,那次會議的意義,就像紅軍長征時的遵義會議。”胡國平說,“從這天起,我們明確了‘語音是唯一方向’的戰(zhàn)略。絕大部分人選擇留下,也不再有任何異議。”
硬實力的積累期注定比圈錢游戲的風口漫長。直到2010年,科大訊飛才真正實現語音識別技術的突破;語音評測業(yè)務則是從2002年起步,到2012年才大規(guī)模落地。
“如果是在其他公司,這些項目十有八九要被砍掉。上學時,老師就告誡我們,要有‘甘坐十年冷板凳’的精神。十年磨一劍,每年進步一點,從量變到質變。”胡國平說,“中科大是為了中國的科技發(fā)展而創(chuàng)立的,從這里走出來的人,普遍有種報國情結。我們能堅持下來,不偏航,歸根到底還是王仁華老師那句話:一定要把中文語音技術掌握在中國人自己手里。”
2024年,胡國平(左二)及團隊成員獲得國家科學技術進步獎一等獎。
在胡國平看來,科技競爭就像蓋高樓,有的樓地基挖得淺、蓋得快,但蓋不高;有的樓光是打地基就需要10年時間,卻可以蓋到100層。“堅守是我們的內核。只要方向是對的,哪怕進步速度慢一些,也要堅守下去,直到撥云見日。”
科技競爭永無止境。胡國平常說的一句話是:可以愛上自己的工作,但不要愛上自己的工作成果。因為只有不斷超越,才能持續(xù)向前。
“在語音技術方面,中美之間本來幾乎沒有差距了,我們甚至還領先一點,但美國憑借其政治力量、資本力量、人才力量,又拉開了一些差距。我們必須全力以赴,爭取讓星火率先燎原。”胡國平說。
推薦閱讀
原創(chuàng)精選
官方微信
官方微博
今日頭條
川公網安備51019002004313號