国产精品久久久久久久久久久久午衣片,无码AV大香线蕉伊人久久蜜臀,欧美日韩亚洲中文字幕三,欧美日韩精品成人网视频

AI在藥物領(lǐng)域的應用情況如何?十問(wèn)拆解“AI+醫藥”

第一部分:大分子

1、AI在不同藥物領(lǐng)域的研發(fā)進(jìn)展?

AI在早期藥物發(fā)現的各個(gè)領(lǐng)域都有應用,化藥因為高質(zhì)量數據多,用算法做分子生成、藥效評估、成藥性預測和毒性分析都有應用。AI在化藥領(lǐng)域的應用已經(jīng)很成熟,比較容易實(shí)現,但是可以做的創(chuàng )新東西不多。


(資料圖片)

大分子的AI計算還處在非常早期的階段,多肽發(fā)展稍微快一些,從單體計算到復合物再到多肽/核酸、多肽/蛋白開(kāi)始做結構設計。但是現在的生物藥都是通過(guò)序列和物理結構做設計,大分子都有柔性片段和三維空間結構,結構這塊的預測和算法發(fā)展很慢。多肽現在已經(jīng)可以做到三四十個(gè)氨基酸的大環(huán)肽,可以做peptide-ADC和peptide-核藥。

蛋白抗體的空間結構更加復雜,抗體的數據都是高度保密的,數據的真實(shí)性問(wèn)題比較大,很多體內篩出來(lái)的抗體流式分析假陽(yáng)性,實(shí)際沒(méi)有辦法和抗原結合,非特異性結合體導致體內脫靶效應很?chē)乐亍,F在大部分公開(kāi)數據都是沒(méi)有經(jīng)過(guò)抗原抗體結合驗證的,整體數據質(zhì)量都比較差。

2、藥企利用AI技術(shù)篩選藥物的主要商業(yè)模式?

藥企和AI公司的合作主要有幾種:1)AI公司自己做藥物開(kāi)發(fā),做到PCC或者IND,然后授權;2)大型制藥公司自己組建AI部門(mén)做算法;3)通過(guò)CRO外包的形式把自己的業(yè)務(wù)外包給AI公司做藥物結構優(yōu)化,按照工時(shí)收費。

大型制藥企業(yè)目前主要通過(guò)收購AI公司,或者拿到AI公司的算法授權,用企業(yè)內部數據訓練模型的方式生成藥物分子,不會(huì )與AI企業(yè)共享數據。但是能夠開(kāi)發(fā)的藥物領(lǐng)域非常多,跨國藥企也很難在每個(gè)細分領(lǐng)域做到數據上的全球領(lǐng)先,AI公司能夠在細分領(lǐng)域做出產(chǎn)品的差異化。

國內真正掌握AIDD的技術(shù)人員非常少,都自己出去創(chuàng )業(yè)了,從2021年開(kāi)始全市場(chǎng)都在招人。企業(yè)自建AI部門(mén)前期投入成本很大,一條管線(xiàn)需要配3-5個(gè)人,整套的計算軟件的費用也比較高。

找AI公司合作一般會(huì )簽署排他協(xié)議,每個(gè)靶點(diǎn)在幾年時(shí)間內只能給一家客戶(hù)服務(wù)。AI公司會(huì )在確定靶點(diǎn)的時(shí)候讓團隊評估公司現有的模型能不能做,或者通過(guò)簡(jiǎn)單的算法迭代能不能實(shí)現,然后再決定接手這個(gè)項目。

3、AI算法與傳統CADD篩選藥物分子的區別?

目前大部分的化學(xué)藥物篩選都是使用的CADD,傳統的CADD講究的是人的研發(fā)經(jīng)驗和計算機輔助設計之間的結合;AIDD的思維方式更偏計算機,會(huì )篩選出全新的藥物骨架。

純算法公司算法的地位很高,實(shí)驗團隊只是個(gè)工具團隊做結果驗證。但是傳統制藥企業(yè)是以臨床導向來(lái)設計開(kāi)發(fā)產(chǎn)品。

4、AI數據庫和算法的核心競爭力?

藥物發(fā)現的數據量越多,準確度就越高,需要不斷去擴充自己的數據庫。公開(kāi)的文獻資料大家都能檢索,但是從自然獲得的天然序列和功能片段每家都會(huì )不一樣。

通用的底層算法在網(wǎng)站上都能免費獲取,但是基于機器訓練學(xué)習的優(yōu)化模塊都是需要商業(yè)付費的。因為每家底層優(yōu)化算法的邏輯不一樣,AI公司在篩選同一個(gè)靶點(diǎn)藥物的時(shí)候也會(huì )生成完全不同的藥物分子。

AI公司的算法團隊每天會(huì )通過(guò)網(wǎng)上發(fā)表的新文獻不斷更新和調試自己的模型,某些熱度比較高的領(lǐng)域甚至每天都會(huì )上線(xiàn)幾百篇新的科研文章。由于數據的真實(shí)性和重現性問(wèn)題,訓練模型采用的方法非常關(guān)鍵。

5、AI行業(yè)近幾年的發(fā)展變化?

蛋白質(zhì)分子結構預測,算法和通量都在提升?,F在6個(gè)氨基酸的已經(jīng)篩的差不多了,氨基酸的序列數量在不斷提升。大分子需要通過(guò)酵母、噬菌體或者mRNA展示平臺進(jìn)行結果確認,現在可以做到酵母展示平臺同時(shí)分析1000條序列。以多肽為例,人工合成幾百條的成本已經(jīng)很低,現在也有在開(kāi)發(fā)多肽的自動(dòng)化合成儀,通量一直在提升。

自動(dòng)化設備只能做重復性的工作,對于不穩定的產(chǎn)品需要多次改變參數,不需要通量提到非常高的水平就足夠用來(lái)訓練模型。

ChatGPT現在有嘗試用氨基酸序列去訓練蛋白質(zhì)語(yǔ)言。

第二部分:算法

1、AI算法在藥物研發(fā)當中的應用場(chǎng)景?

早期主要做靶點(diǎn)發(fā)現,聯(lián)合用藥機理研究,通過(guò)敲出基因降解蛋白研究疾病發(fā)生的原因。小分子目前已經(jīng)發(fā)展到給定一個(gè)蛋白表面的口袋(與藥物結合的位點(diǎn)),就可以用算法生成藥物分子,交給藥物化學(xué)專(zhuān)家再做進(jìn)一步的結構優(yōu)化和CMC。大分子這兩年進(jìn)步很快,可以根據靶點(diǎn)生成蛋白,然后交給做實(shí)驗的部門(mén)確認。

AI能夠幫助研發(fā)人員尋找到親和力最好的藥物分子,但是在實(shí)際疾病治療過(guò)程中, 親和力最好的分子不一定是藥效最好的分子,對疾病發(fā)生治療的全面了解,是AI目前無(wú)法替代的部分。

2、AI算法底層架構的來(lái)源?

有些公司會(huì )直接用已經(jīng)公開(kāi)發(fā)表的算法,有些公司會(huì )根據公開(kāi)算法做進(jìn)一步優(yōu)化,有些甚至會(huì )盜用其它企業(yè)的算法。算法底層的邏輯都差不多,但是在細分抗體結構域的優(yōu)化方面每家有自己的特點(diǎn),各家企業(yè)會(huì )通過(guò)自己獨有的數據庫訓練優(yōu)化,形成各家獨有的產(chǎn)品管線(xiàn)。算法的更新迭代騰訊和字節這類(lèi)公司做得更多。傳統大藥企的核心在于CMC、臨床和商業(yè)化,海外的大藥企也更傾向從biotech購買(mǎi)新發(fā)現的分子。

3、傳統大藥企和AI制藥公司的差異?

傳統的大藥企也在嘗試搭建相關(guān)的團隊,但是生物學(xué)家不懂計算, 生物學(xué)家更傾向通過(guò)自己的經(jīng)驗去優(yōu)化分子,有自己的路徑依賴(lài),但是比較費錢(qián)費時(shí)間;算法公司可以直接生成分子,但是算法的底層框架和傳統篩選方法不同,不一定能夠被生物學(xué)家很好的理解。藥物研發(fā)到了CMC之后的階段,算法能夠提供的幫助就非常有限了,臨床試驗的時(shí)間也是沒(méi)有辦法通過(guò)算法縮短的。

4、AI制藥目前在國內的發(fā)展階段?

過(guò)去幾年Google、Amazon、Microsoft在底層算法上取得了非常大的進(jìn)步, 2017年Transformer模型出現,2020年α fold在此技術(shù)上實(shí)現了蛋白結構的解析,算法層面實(shí)現比較大的突破。數據方面一直是在緩慢積累的,屬于緩變量。大分子結合面比較大,這幾年進(jìn)步非???小分子在分子動(dòng)力學(xué)方面(小分子和蛋白結合)進(jìn)展很慢,小分子結合面很小,算法要求非??量?,進(jìn)展緩慢。

2018年設計的分子, 可能剛做到IND階段,這兩三年很關(guān)鍵,能夠初步驗證第一批篩選出來(lái)的分子是否能夠成功進(jìn)入臨床實(shí)現商業(yè)化。以前篩選分子需要耗費上千萬(wàn)的費用, 一年以上的時(shí)間;AI算法可能幾十萬(wàn)一個(gè)月就能完成。分子生成的速度現在很快,根據特定的靶點(diǎn)生成對應的蛋白幾周就可以完成,然后通過(guò)2-3周的實(shí)驗驗證就可以完成初步的驗證。以前傳統的藥物篩選方式需要建立10^8以上的蛋白庫做驗證,非常耗時(shí)成本也很高。AI在計算的時(shí)候就可以直接完成親和力方面的結構優(yōu)化,傳統篩選方式篩出來(lái)的蛋白還需要后續進(jìn)行結構優(yōu)化?,F在計算已經(jīng)很快了,但是都需要做實(shí)驗驗證,速度沒(méi)有辦法提得更快,也沒(méi)有必要在后續實(shí)驗數據不充分的情況把所有的分子結構都計算完。

5、各AI企業(yè)的主要差異?

所有的AI模型都是基于α fold的基礎建立的,每家用自己獨有的數據庫進(jìn)行訓練和微調,方法論是通用的,只是大家選的研究方向不一樣,國外開(kāi)源的數據庫很多。理論上國內的CRO公司是不能采用客戶(hù)的數據進(jìn)行模型訓練的,需要得到客戶(hù)的授權,并且客戶(hù)的數據也不夠完整。

本文轉載自“價(jià)投幫”公眾號;智通財經(jīng)編輯:陳雯芳。

關(guān)鍵詞: