最近幾年參加了全國科學技術名詞審定委員會組織的《生物化學與分子生物學名詞》(第二版)審定和《英漢生物學大詞典》的編撰,同時筆者編寫了《蛋白質導論》一書。在這過程中,深感蛋白質定名是一個非常復雜、令人煩惱和困惑的事。
早年蛋白質的命名相對比較簡單,因為蛋白質的研究是從分離、純化和理化性質鑒定開始,而后進行功能研究。蛋白質的命名就是根據(jù)來源、分離的過程、理化性質和功能等特征來確定[1]。譯名確定也比較簡單,基本是直譯。但是,由于早年技術條件的限制,對一些活性物質的結構特征還不了解,因此,在譯名時,廣泛地使用了“素”。除了抗菌素和維生素,很多物質也被稱為“素”,某些蛋白質也不例外,胰島素就是一個典型的例子。
隨著越來越多的物種的基因組完成了全序列的測定,一個基因對應了一個蛋白質,為此,蛋白質的數(shù)量幾乎在以指數(shù)曲線的形式增加。這就使蛋白質命名的問題更加突出。
基因的主要職責是負責遺傳信息的傳代和蛋白質的編碼,對它們的命名和定名似乎沒有遇到什么困難。與表型明確相關的,就用一個名詞,如玭otch、wingless、sex lethal等。還經常給予基因一個縮寫和編號,例如參與細胞分裂調節(jié)(cell division control)的基因為玞dc,因有關的基因很多,就在其后加上數(shù)字編號,玞dc4、玞dc25等;一時還無法了解其生物學意義的基因也可以用一個符號。
然而,蛋白質與基因卻有明顯的不同,因為提起蛋白質,一定會聯(lián)想到它們的性質和功能。在功能仍不清楚的情況下,對蛋白質的命名當然也可以用符號。根據(jù)分子質量就命名了很多蛋白質,例如p53、p21等。這樣的命名也有不全面之處,因為分子質量相同的蛋白質在自然界中是不勝枚舉的。在同一個復雜的體系中得到的諸多蛋白質也使用了編號,例如核糖體中的蛋白質,定位小亞基上的冠以S,定位在大亞基上的以L開頭,然后是數(shù)字編號;構成核孔的許多蛋白質就用NuP加數(shù)字表示。這些符號為蛋白質的命名減少了很多麻煩。至于對有明確生物學含義的基因所表達得到的蛋白質,通常是將斜體扶正,也即認為是對蛋白質的定名,例如玭otch基因的表達產物,即定名為notch蛋白(質)。筆者認為不應簡單地以外文定名,而應該以其生物學意義對蛋白質命名或定名,玭otch基因的表達蛋白質應定名為刻缺蛋白。
蛋白質定名,更多的是蛋白質英文譯名的確定,看似簡單,但仍遇到很多問題。
首先是,很多學者,尤其是醫(yī)學工作者,仍然喜歡使用“素”,例如integrin被稱為“整合素”。早年在不了解某種活性物質的屬性時,使用“素”字無可非議,如今已明確知道integrin是一類蛋白質,若譯名能反映其屬性,則更確切。即“整合蛋白”(或“整聯(lián)蛋白”)比“整合素”合適;“泛蛋白”比“泛素”更好。目前一些生物學出版物中,往往還是將兩者并用[2]。對此筆者建議定一個原則,如果一個活性物質其屬性已確定為蛋白質或肽,則其譯名應盡量使用“某某蛋白”或“某某肽”,如defensin,可定名為“防衛(wèi)肽”而非“防衛(wèi)素”。
其次,在確定譯名時,應盡可能地考慮到外文名的由來,不必根據(jù)外文詞直譯。例如selectin曾被譯為“選擇素”,其實其詞根是lectin,含凝集素的意義,將其譯為“選擇凝(集)素”或許更合理,簡化為“選凝素”則更簡潔。同理collectin的直譯則是“收集素”,根據(jù)外文的構詞,其詞根也是lectin,前綴col來源于collagen,全面考慮,則其譯名以“膠原凝(集)素”為佳。另外,外國人很喜歡顯示他們的特有文化。例如,Janus kinase(一種激酶)多被直譯為詹納斯激酶(Jak)[2],其實Jak兼有轉錄因子的功能,同時英文中Janus是羅馬神話中的一位具有兩副面孔的門神,既看前面,又看后面,January(一月)便是既看過去的一年又看即將來臨的一年之意,因此考慮到Jak既看信號的傳送,又看到蛋白質的轉錄,譯為兩面激酶也是一個不錯的選擇。再如,一種促進胚胎頭部發(fā)育的蛋白質,英文名為cerberus,當然可以音譯為“塞貝魯斯”,但因原文為希臘和羅馬神話中守衛(wèi)冥府入口的三頭狗,故建議定名為“促頭蛋白”。另有一些名稱是根據(jù)原國文字的特點用英文命名。例如ryudocan,此詞源于日文的ryudousei,意為流動狀態(tài),因此根據(jù)英文是無法給予確切的譯名的。對這樣的定名,最好是追溯該詞的由來,即查閱原始文獻,根據(jù)作者的命名依據(jù),進行譯名的確定。為此,筆者建議將ryudocan定名為“流態(tài)蛋白聚糖”。
這樣來定名一個術語是很費力耗時的,但這能使定名更確切,能夠望文生義。
理想的譯名應兼顧音譯和意譯兩方面。gene譯為基因是典型佳作,因它是遺傳時的“基(本)因(素)”。motif是一個法文詞,有多種含義,但是均離不開“基本構件”的意思,曾譯為“基序”(基本的序列),后來在蛋白質的立體結構中也使用此詞,顯然“基序”不足以涵蓋全部含義,筆者建議定名為“模體”,意為“規(guī)范的實體”,且與外文諧音。目前使用“模體”的人在增多。SUMO是一個使用日益頻繁的縮寫,其全名是Small Ubiquitin-related Modifier。如果使用全名“小的泛素相關修飾劑”,似乎太長,失卻了使用縮寫的意義,為此,筆者建議定名為“修模蛋白”,既是音譯,也考慮其在修飾時,被整體地作為模塊使用。
在外文中,經常將一個詞組中各個詞的詞頭組合在一起,構成新詞,并以此命名蛋白質。serpin的全名是serine protease inhibitor,筆者曾提議定名為“抑絲酶”,但遭到從事酶學研究的同人反對,認為這樣的定名會誤導為這是一種酶,而非抑制劑。他們的顧慮不無道理。但是,筆者認為既然是一個縮寫,就應盡可能地以縮寫來定名,以全名的譯名作為縮寫的譯名,似乎總有些別扭??s寫PTEN的全名是phosphatase and tensin homology deleted on chromosome ten,其譯名為“在10號染色體有缺失的磷酸酶及張力蛋白同源蛋白”,若將4個英文字母的縮寫譯為一長串中文則使人啞然。建議此縮寫譯為“10號蛋白”或“十號蛋白”。
對這類詞頭組合詞命名時使用音譯是下策,
但有時又是無奈之舉,如ADAM為英文詞組a disintegrin and a metalloproteinase的詞頭組合詞,全稱為“解整聯(lián)蛋白及金屬蛋白酶”。創(chuàng)造ADAM縮寫的這位學者肯定是聯(lián)想到人的祖先,那不妨將其定名為“亞當?shù)鞍住?。與serpin類似的還有eppin,其全名為epididymal protease inhibitor(附睪分泌的蛋白酶抑制劑),在全面考慮后,很難給出確切譯名時,建議主張音譯為“艾匹”;serpin也不妨音譯為“絲匹”。
在一種材料中,分離得到多種不同功能的蛋白質是很自然的。然而,往往將一種較先發(fā)現(xiàn)的、功能特定的蛋白質命名為此材料中蛋白質的總稱。例如在由栝樓根制備得到的天花粉中提取的核糖體失活蛋白質曾被定名為天花粉蛋白,英文為trichosanthin[2]。其實,在天花粉中至少還存在著另一種凝集素,因此,trichosanthin定名為天花粉毒蛋白更確切。
大量的事實表明,一個蛋白質,即使分子量不是很大,也可以呈現(xiàn)幾種不同的功能,因此,對這類蛋白質的命名如果僅反映了其形狀和功能的一個方面,似乎總有缺陷。可是,這是無法避免的。因為隨著研究在不斷地深入,開始的命名肯定無法涵蓋以后研究的成果。然而,往往幾個實驗室同時研究一個蛋白質,各自又根據(jù)自身的研究結果對此蛋白質進行了不同的命名,例如L-選凝素,
這些名稱的統(tǒng)一是很有必要的[3]。這一蛋白質,在得到cDNA時,因其相當于MEl-14抗原而被命名為MEl-14。但是在得到其cDNA以前,各家實驗室對其已有不同的稱謂:LEC-CAM、Ly-22、Leu8、TQ1、DREG-56和LAM-1等。后經多方協(xié)商,最后定名為L-selectin,譯名為L-選凝素。
總之,蛋白質的命名是一個非常復雜的問題,上面僅是筆者碰到和所能想到的一些難處。如果能有一個為絕大多數(shù)人認可的蛋白質命名原則或規(guī)則,那么,任何人在遇到新的蛋白質外文名詞時,就能根據(jù)這個規(guī)則提出建議的譯名,而后經多方確認后,就可給予正式的定名。這樣,可以使蛋白質的命名“群眾化”,每一位從事蛋白質科研、教學的人員都能為蛋白質命名貢獻力量。在群策群力的基礎上,使得中國的學術刊物更多地使用規(guī)范的中文學術名詞。
參 考 文 獻
[1]王克夷.蛋白質導論.北京:科學出版社,2007:2-4.
[2]金冬雁,黎孟楓.英漢分子生物學與生物工程詞匯.北京:科學出版社,2003.
[3]http://cn.expasy.org/uniprot/P14151.
王克夷:中國科學院上海生命科學院生物
化學與細胞生物學研究所,200031