袁斯來
10年前,張濟(jì)徽第一次發(fā)現(xiàn)專利數(shù)據(jù)庫這座“金礦”,多少有些偶然。他當(dāng)時(shí)還是新加坡國立大學(xué)的學(xué)生,參加了學(xué)校的創(chuàng)業(yè)項(xiàng)目,到美國費(fèi)城一家做醫(yī)療器械的初創(chuàng)公司實(shí)習(xí)。那家公司員工只有兩個(gè)創(chuàng)始人,張濟(jì)徽相當(dāng)于001號員工,公司還沒有自己的產(chǎn)品。
不過他們很快就起步了,靠的竟然是東海岸一家倒閉公司的專利技術(shù)。
這家公司原本給醫(yī)院提供心臟搭橋手術(shù)中使用的血管支架。張濟(jì)徽的老板讓張濟(jì)徽研究后,將相關(guān)技術(shù)收購過來,把產(chǎn)品改造成血管透析患者專用的血管支架。這也成了這家初創(chuàng)公司的主打產(chǎn)品,幫他們拿到了一筆不小的融資。
這件事讓張濟(jì)徽看到了專利數(shù)據(jù)的價(jià)值。歐洲專利局曾經(jīng)統(tǒng)計(jì)過,全球有80%的技術(shù)信息只存在于專利之中,其余則分散在論文、文獻(xiàn)等學(xué)術(shù)資料里。全球數(shù)以億計(jì)的專利文獻(xiàn),無疑是一座巨大的“金 礦”。
回到新加坡后,張濟(jì)徽創(chuàng)立了專利數(shù)據(jù)公司智慧芽(PatSnap)。目前,智慧芽已經(jīng)涵蓋了100多個(gè)國家和地區(qū)的1億條專利,擁有5000多家客戶。智慧芽的盈利模式和湯森路透類似,售賣數(shù)據(jù)庫,按年收費(fèi),目前基本達(dá)到了盈虧平衡,客單價(jià)平均從幾萬到幾百萬元不等。
在美國的經(jīng)歷讓張濟(jì)徽意識到,挖掘全球?qū)@@座金礦,最基本的工具是“檢索”和“分析”。而整合全球?qū)@麛?shù)據(jù)庫到統(tǒng)一平臺,并有效聚合,是張濟(jì)徽要做的“基本建設(shè)”。
所以PatSnap第一步是先把數(shù)據(jù)庫做起來,以專利檢索為切入口。
全球的專利文獻(xiàn)都是以紙質(zhì)文本的形式保存在各國專利機(jī)構(gòu)中,或以電子文檔的形式儲存在它們的網(wǎng)站上。但要在浩瀚的文獻(xiàn)庫中檢索到“有用”的專利文獻(xiàn),難度遠(yuǎn)遠(yuǎn)超過在網(wǎng)絡(luò)上搜索一件產(chǎn)品或一家公司。而且很多專利申請都有一個(gè)拗口的標(biāo)題,要準(zhǔn)確找到它們是一件“技術(shù)活”,如一款圖片特效工具,對應(yīng)的專利名稱可能是“一種數(shù)字圖像蠟筆特效的快速生成方法”。如果以關(guān)鍵詞“蠟筆特效”檢索,會搜索出很多和美術(shù)相關(guān)的專利,說不定還有玩具“蠟筆小新”。
實(shí)際上,如果是財(cái)大氣粗的公司,可以選擇商業(yè)性的專利數(shù)據(jù)庫,如湯森路透的“德溫特”專利數(shù)據(jù)庫。它早在1960年代就創(chuàng)立,是業(yè)界公認(rèn)的最權(quán)威的知識產(chǎn)權(quán)檢索庫。但是,要用好它,用戶也得自己是個(gè)“行家”,或者擁有資深的知識產(chǎn)權(quán)律師或分析師團(tuán)隊(duì)。另一個(gè)關(guān)鍵是,它們很昂貴,德溫特對一個(gè)汽車工業(yè)數(shù)據(jù)庫的定價(jià)在50萬美元以上。
如果沒錢養(yǎng)人和買數(shù)據(jù)庫,技術(shù)總監(jiān)或商務(wù)拓展專員就得自己動手,在各個(gè)國家專利局網(wǎng)站的數(shù)據(jù)庫搜索,或者用免費(fèi)的軟件代勞,但檢索結(jié)果的可信度無法和收費(fèi)軟件相比。更不用說很多歐洲專利使用法文或德文書寫,要弄懂這些文件,已經(jīng)超出一家普通公司的能力。如果碰巧公司的競爭對手在泰國,很可能需要到泰國專利局一本本翻閱紙質(zhì)文件。
張濟(jì)徽的目標(biāo)是為用戶提供一個(gè)易用、平價(jià)版的德溫特專利數(shù)據(jù)庫。在母校新加坡國立大學(xué)提供的幾平方米的辦公室里,張濟(jì)徽畫出了智慧芽的產(chǎn)品草圖。他設(shè)計(jì)了一個(gè)對話框式的搜索欄,用戶使用時(shí)可以用自然語句完成搜索,整個(gè)使用流程類似于在學(xué)校時(shí)使用中國知網(wǎng)搜索論文。
10年來智慧芽的核心產(chǎn)品在外觀和使用方法上一直沒有太大變化?!拔业恼麄€(gè)產(chǎn)品就是要人性化,讓一個(gè)普通用戶不需要學(xué)習(xí),甚至沒有人輔助也能迅速上手學(xué)會,其實(shí)就是把復(fù)雜的東西變簡單?!睆垵?jì)徽對《第一財(cái)經(jīng)周刊》說。
不過,紙上談兵很簡單,真正落地時(shí),張濟(jì)徽才發(fā)現(xiàn)自己在數(shù)據(jù)這行還非?!睙o知”?!爱?dāng)時(shí)可以說是初生牛犢不怕虎,想得很簡單,以為有了數(shù)據(jù),很容易就能做個(gè)搜索引擎出來,然后就會有客戶了?!睆垵?jì)徽回 憶。
在融資和創(chuàng)業(yè)環(huán)境有些冷清的新加坡,張濟(jì)徽手里只有新加坡國立大學(xué)給的一筆5萬新元的創(chuàng)業(yè)扶持基金,差不多相當(dāng)于25萬元人民幣,而當(dāng)時(shí)購買一個(gè)歐洲小國家的專利數(shù)據(jù)庫就要20萬元人民幣左右。沒有數(shù)據(jù)庫,他們接下來的開發(fā)真正如無米之炊。
最初,張濟(jì)徽只能和技術(shù)人員四處到公開網(wǎng)站上抓取數(shù)據(jù),下苦力一點(diǎn)點(diǎn)積累。但這些扒來的數(shù)據(jù)七零八落,缺斤少兩,要靠它們建立自己的數(shù)據(jù)平臺顯然不可能。張濟(jì)徽抱著死馬當(dāng)活馬醫(yī)的心態(tài),在論壇上廣發(fā)帖子,尋找愿意出售數(shù)據(jù)庫的人。沒想到一家邁阿密的第三方數(shù)據(jù)公司看在張濟(jì)徽學(xué)生創(chuàng)業(yè)的份上回復(fù)了他,最后以“友情價(jià)”給了他們一批美國專利數(shù)據(jù)。這幾百萬條數(shù)據(jù)讓智慧芽有了開發(fā)產(chǎn)品的“原料”,才算打開了局面。
最難啃的骨頭,是數(shù)據(jù)的清洗。他們得把不同格式、語言的數(shù)據(jù)全部統(tǒng)一到一個(gè)架構(gòu)中,讓用戶用中文就能夠直接搜索到歐洲的專利?!懊總€(gè)國家的語言、格式都有不同,這些要整合到一個(gè)數(shù)據(jù)庫中,同時(shí)還保證搜索的準(zhǔn)確和清楚,這需要大量前期的工作。”紅杉資本中國基金合伙人計(jì)越告訴《第一財(cái)經(jīng)周刊》。
張濟(jì)徽兼任CEO和產(chǎn)品經(jīng)理,靠著朋友關(guān)系接一些外包項(xiàng)目勉強(qiáng)養(yǎng)活開發(fā)人員,足足忙了兩年,才拿出了一個(gè)產(chǎn)品原型。
2009年算是比較好過的一年,張濟(jì)徽的學(xué)妹關(guān)典加入了團(tuán)隊(duì),成了智慧芽合伙人,分擔(dān)了銷售的工作??恐扔腥嗣}資源和四處奔走,他們積累了第一批客戶。而且,他們及時(shí)地獲得了新加坡政府扶持創(chuàng)業(yè)公司的一筆投資。
但沒想到的是,這只是又一個(gè)低谷的前奏。由于缺少經(jīng)驗(yàn),張濟(jì)徽他們一口氣招聘了20多個(gè)人,對于一個(gè)剛畢業(yè)沒多久的學(xué)生來說,他根本沒法管理這樣規(guī)模的團(tuán)隊(duì)?!皼]有招聘經(jīng)驗(yàn),什么人都進(jìn)來了,管理出了很大問題?!睆垵?jì)徽說。
到了2011年,產(chǎn)品基本上處于癱瘓狀態(tài)。張濟(jì)徽折騰了4年,沒想到回到了原點(diǎn)?!爱?dāng)時(shí)真的非常魯莽,因?yàn)榭焖倜つ繑U(kuò)張,我們犯了初步創(chuàng)業(yè)者都犯的很多錯(cuò)誤,可以說那是最低潮、最沮喪的時(shí)候?!彼貞浀?。
張濟(jì)徽果斷停下了持續(xù)了半年的招聘,還裁掉了一批人,帶著剩下的員工從最基礎(chǔ)的產(chǎn)品架構(gòu)開始,全部推到重來?;苏蟀肽甑臅r(shí)間閉關(guān),到了2011年年底,產(chǎn)品才重新上線?!巴饷婵粗且粯拥?,但底層結(jié)構(gòu)已經(jīng)全部不同了?!睆垵?jì)徽說。endprint
但原來的客戶已經(jīng)流失大半,他們不得不從頭開始跑客戶。張濟(jì)徽嘗到了魯莽冒進(jìn)的“苦 果”。
轉(zhuǎn)機(jī)來自張濟(jì)徽在倫敦的一次巧遇。他在參加行業(yè)展會時(shí),認(rèn)識了自己后來的合伙人。合伙人當(dāng)時(shí)賣的是行業(yè)報(bào)告,不過他的銷售方式不是“地推”,而是純電話營銷。張濟(jì)徽了解到他們業(yè)績做得還不錯(cuò),抱著試試看的心態(tài),他把智慧芽產(chǎn)品交給合伙人代理。沒想到一年后,那位合伙人和另一個(gè)員工,靠在房間里打電話竟然賣掉了幾百萬元的產(chǎn)品。
“國外對電話營銷接受度比較高,這讓我覺得電話營銷是可行的,成本低不說,整個(gè)簽單流程也從以前的幾個(gè)月壓縮到了四五十天。”張濟(jì)徽說。
對于智慧芽這樣的產(chǎn)品,電話營銷可說是一種性價(jià)比極高的銷售方式?,F(xiàn)在,智慧芽的海外業(yè)務(wù)中,絕大多數(shù)都是通過電話售賣,目前國內(nèi)的電話營銷占比也不 少。
對張濟(jì)徽來說,搜索目標(biāo)達(dá)到后,接下來的數(shù)據(jù)分析更值得“深挖”,而且這一市場的空間更大,用戶黏性也更強(qiáng)。
對于一種技術(shù)密集型產(chǎn)品,可能會有上千篇專利文獻(xiàn),一個(gè)時(shí)間緊迫的研發(fā)總監(jiān),根本沒有時(shí)間逐一閱讀和消化,很多時(shí)候,他迫切需要先建立一個(gè)粗淺但全面的了解?!捌髽I(yè)級軟件有個(gè)特點(diǎn),用戶不會管技術(shù)怎么樣,他們需要知道問題在哪兒,行業(yè)垂直應(yīng)用的實(shí)際解決方案是什么。所以比搜索更重要的是分析?!庇?jì)越 說。
在最初的版本里,張濟(jì)徽只做了簡單的分類,比如國別或發(fā)明人,沒有更細(xì)化的技術(shù)領(lǐng)域分類。調(diào)好了架構(gòu)后,他們花了很大的力氣研究如何處理自然語言,提取出文獻(xiàn)中的關(guān)鍵詞。其中最麻煩的是語言的多義性,比如同樣是單詞“neddle”,在醫(yī)藥領(lǐng)域涉及的是和“針”相關(guān)的專利,但到打印機(jī)里,它的意思就成了“點(diǎn)陣打印”。智慧芽用機(jī)器學(xué)習(xí)和文本分析的辦法,輔助人工,一步步教會系統(tǒng)“理解”這些詞語的不同含義。
為了讓整個(gè)分析更加清晰,他們還開發(fā)了3D專利地圖。它類似于景觀圖,有山峰和洼地,分別代表不同的技術(shù)領(lǐng)域,用戶能一目了然地看清自己想要做的技術(shù),是已經(jīng)在山峰、屬于最熱門的“紅海”領(lǐng)域,還是在谷底、關(guān)注度低的“藍(lán)海”區(qū)。
當(dāng)通用型分析產(chǎn)品相對成熟后,智慧芽的分析開始往垂直領(lǐng)域深耕。在計(jì)越看來,定制化的分析方案才是建立起壁壘的關(guān)鍵。“企業(yè)級別的軟件可說沒有技術(shù)訣竅,最后還是要靠對行業(yè)的理解和深入,你會別人不會,這個(gè)才是越來越高的門檻?!庇?jì)越說。
這次產(chǎn)品迭代對張濟(jì)徽來說,又是一個(gè)水很深的“坑”。隔行如隔山,要進(jìn)入全新的領(lǐng)域,所有的數(shù)據(jù)庫必須重新做定制化改造。而每一家企業(yè)都有自己的需求,比如樂高的積木耦合技術(shù)早就過了專利保護(hù)期,它們現(xiàn)在關(guān)注的反而是制造材料方面的專利。
智慧芽第一個(gè)深度切入的是用戶需求最多的化學(xué)領(lǐng)域,這個(gè)搜索引擎為醫(yī)藥、涂料、電器公司的客戶提供基于化學(xué)式的專利分析服務(wù)。在這個(gè)行業(yè),專利文獻(xiàn)最大的特點(diǎn)是會有長長的分子式。但工作人員平時(shí)習(xí)慣看對應(yīng)的分子結(jié)構(gòu)圖。在專利文獻(xiàn)中,這些結(jié)構(gòu)圖都放在附錄部分,圖片和文字沒有對應(yīng),給閱讀造成很大的障礙?!坝泻芏嗉夹g(shù)訣竅在里面,必須招聘很多化學(xué)行業(yè)的專家來指導(dǎo)我們。”張濟(jì)徽說。
智慧芽用圖像識別技術(shù),抽取出專利中的圖片,再和化學(xué)式綁定,這樣一來,用戶在點(diǎn)擊化學(xué)式時(shí),就能直接看到對應(yīng)的圖片。
化學(xué)領(lǐng)域的結(jié)果分析也有一套專門的方案。這一領(lǐng)域的專利創(chuàng)新,主要是在結(jié)構(gòu)式上動腦筋。有時(shí)只要在既有的分子結(jié)構(gòu)上加入一個(gè)節(jié)點(diǎn),就是一門新技術(shù)。所以,智慧芽的檢索也在之前的以專利人、機(jī)構(gòu)、技術(shù)分類上,加上了分子式的結(jié)構(gòu)搜索和對比。
“要做基礎(chǔ)搜索很簡單,但最難的是用圖像識別技術(shù)抓取圖片后,找到化學(xué)式之間的關(guān)系,給到用戶建議?!标P(guān)典表示。而且“這個(gè)行業(yè)不是有錢就行,每個(gè)行業(yè)有每個(gè)行業(yè)的規(guī)矩,得靠一個(gè)個(gè)用戶使用場景積累經(jīng) 驗(yàn)?!?/p>
化學(xué)行業(yè)有細(xì)化的要求,金融行業(yè)反而更關(guān)注“大局”。當(dāng)投資機(jī)構(gòu)考慮是否要收購一家公司時(shí)需要考慮很多因素,比如一個(gè)熱門專利的發(fā)明人正好是某個(gè)公司的合伙人,再綜合以往的融資新聞、產(chǎn)品發(fā)布情況,如果這個(gè)公司還處于早期,估值不高,又有核心的技術(shù),那么收購這家公司可能就是筆比較劃算的買賣。“現(xiàn)在投資很多是投硬技術(shù)了,以往它們不太關(guān)注技術(shù)這方面,不過現(xiàn)在越來越重視了?!标P(guān)典說。
計(jì)越顯然認(rèn)為智慧芽選擇了一個(gè)綿延不斷的巨大“風(fēng)口”,這也是去年11月紅杉資本領(lǐng)投數(shù)智慧芽C輪融資的原因。此前在2014年,智慧芽完成由新加坡淡馬錫旗下機(jī)構(gòu)投資的A輪融資,2015年11月獲得美國Summit Partner的千萬美元B輪投資。
現(xiàn)在的智慧芽已經(jīng)不單單是專利數(shù)據(jù)搜索引擎,在關(guān)典看來,他們現(xiàn)在是要圍繞知識產(chǎn)權(quán)和其他信息,提供整合分析的解決方案,“以前是解決一些點(diǎn),現(xiàn)在是回答從頭到尾的商業(yè)問題?!标P(guān)典說。endprint