Jak generativní umělá inteligence přispívá k objevování léků?

Generativní umělá inteligence přispívá k objevování léků generováním kandidátních molekul, předpovídáním jejich vlastností a efektivnějším zkoumáním biologických hypotéz. Umožňuje týmům rozšířit generování nápadů a poskytuje více možností pro experimentální testování.

Může generativní umělá inteligence snížit počet experimentů potřebných k objevování léků?

Ano, generováním široké škály kandidátních molekul a hypotéz před testováním umožňuje generativní umělá inteligence týmům provádět méně „slepých“ experimentů, což v konečném důsledku maximalizuje efektivitu procesu objevování léků.

Jaké jsou klíčové výhody využití generativní umělé inteligence při objevování léků?

Mezi klíčové výhody použití generativní umělé inteligence při objevování léčiv patří rychlejší iterační cykly, vylepšené generování hypotéz, posílené diskuse napříč obory a schopnost upřednostňovat experimenty na základě informovaných predikcí.

Jaká opatření je třeba přijmout při používání generativní umělé inteligence při vývoji léků?

Je zásadní vynucovat přísná omezení, validovat výstupy jako hypotézy a udržovat komplexní sledovatelnost pokynů a rozhodnutí, aby se zabránilo potenciálnímu zneužití nebo chybné interpretaci výsledků.

Jak týmy zajišťují spolehlivost výstupů z generativní umělé inteligence?

Týmy by měly výstupy z generativní umělé inteligence považovat za hypotézy k testování, ověřit je pomocí testů a ortogonálních modelů a před zahájením jakýchkoli experimentálních plánů aplikovat filtry k eliminaci nesmyslných výsledků.

Jaké typy molekul může generativní umělá inteligence pomoci objevit?

Generativní umělá inteligence může pomoci s objevováním jak malých molekul, tak biologických léčiv generováním kandidátních sekvencí, navrhováním modifikací a navrhováním syntetických cest na základě předem definovaných omezení.

Je nutný lidský dohled při používání generativní umělé inteligence pro objevování léků?

Ano, lidský dohled je nezbytný pro řízení procesu, validaci generovaných výstupů a zajištění souladu zjištění s biologickými a chemickými znalostmi, čímž se proces rozhodování stává robustnějším.

Jaká omezení by si týmy měly být vědomy při používání generativní umělé inteligence?

Týmy by si měly být vědomy toho, že generativní umělá inteligence může někdy produkovat věrohodně znějící výsledky, které jsou však nesprávné. Technologie může mít také zkreslení na základě trénovacích dat, což vede k potenciálním rizikům v kvalitě výstupu.

Jaká je role generativní umělé inteligence při objevování léků?

Stručná odpověď: Generativní umělá inteligence urychluje především časný objev léků generováním kandidátních molekul nebo proteinových sekvencí, navrhováním syntetických cest a vynášením testovatelných hypotéz, takže týmy mohou provádět méně „slepých“ experimentů. Nejlépe funguje, když vynucujete přísná omezení a ověřujete výstupy; pokud je brána jako věštba, může s jistotou zavádět.

Klíčové poznatky:

Zrychlení: Využijte GenAI k rozšíření generování nápadů a poté je zúžte pomocí důkladného filtrování.

Omezení: Před generováním vyžadovat rozsahy vlastností, pravidla generování a limity novosti.

Validace: Výstupy považovat za hypotézy; potvrdit je pomocí testů a ortogonálních modelů.

Sledovatelnost: Zaznamenávejte výzvy, výstupy a zdůvodnění, aby rozhodnutí zůstala auditovatelná a kontrolovatelná.

Odolnost proti zneužití: Zabraňte únikům informací a přehnané sebedůvěře pomocí správy, kontrol přístupu a lidské kontroly.

Jaká je role generativní umělé inteligence při objevování léků? Infografika

Články, které byste si mohli po tomto přečíst:

🔗 Role umělé inteligence ve zdravotnictví
Jak umělá inteligence zlepšuje diagnostiku, pracovní postupy, péči o pacienty a výsledky.

🔗 Nahradí umělá inteligence radiology?
Zkoumá, jak automatizace rozšiřuje radiologii a co zůstává lidské.

🔗 Nahradí umělá inteligence lékaře?
Upřímný pohled na dopad umělé inteligence na práci a praxi lékařů.

🔗 Nejlepší nástroje umělé inteligence pro vědecké objevy
Špičkové nástroje pro laboratoře umělé inteligence pro urychlení experimentů, analýz a objevů.

Role generativní umělé inteligence při objevování léků, jedním dechem 😮💨

Generativní umělá inteligence pomáhá farmaceutickým týmům vytvářet kandidátní molekuly, předpovídat vlastnosti, navrhovat modifikace, navrhovat syntetické cesty, zkoumat biologické hypotézy a zkracovat iterační cykly – zejména v raných fázích objevování a optimalizace potenciálních produktů. Nature 2023 (přehled objevování ligandů) Elsevier 2024 (generativní modely v de novo návrhu léčiv)

A ano, dokáže také s jistotou generovat nesmysly. To je součástí dohody. Jako velmi nadšený stážista s raketovým motorem. Průvodce pro lékaře (riziko halucinací) npj Digital Medicine 2025 (halucinace + bezpečnostní rámec)

Proč je to důležité víc, než si lidé připouštějí 💥

Spousta objevitelské práce je vlastně „hledání“. Hledejte v chemickém prostoru, v biologii, v literatuře, v vztazích mezi strukturou a funkcí. Problém je v tom, že chemický prostor je… v podstatě nekonečný. Accounts of Chemical Research 2015 (chemický prostor) Irwin & Shoichet 2009 (měřítko chemického prostoru)

Mohli byste strávit několik životů jen zkoušením „rozumných“ variant.

Generativní umělá inteligence posouvá pracovní postup z:

„Pojďme vyzkoušet, co nás napadne“

na:

„Vygenerujme větší a chytřejší sadu možností a pak otestujme ty nejlepší.“

Nejde o vyloučení experimentů. Jde o výběr lepších experimentů. 🧠 Nature 2023 (přehled objevů ligandů)

Také, a o tom se málo diskutuje, pomáhá to týmům komunikovat napříč obory. Chemici, biologové, lidé z DMPK, počítačoví vědci… každý má jiné mentální modely. Slušný generativní systém může sloužit jako sdílený skicák. Recenze Frontiers in Drug Discovery 2024

Co dělá dobrou verzi generativní umělé inteligence pro objevování léků? ✅

Ne všechna generativní umělá inteligence je si rovna. „Dobrá“ verze pro tento prostor se méně točí kolem okázalých ukázek a více kolem neatraktivní spolehlivosti (neatraktivní je zde ctnost). Nature 2023 (recenze objevu ligandů)

Dobré nastavení generativní umělé inteligence má obvykle:

Uzemnění domény: trénováno nebo adaptováno na chemická, biologická a farmakologická data (nejen obecný text) 🧬 Recenze Elsevier 2024 (generativní modely)
Omezení – první generace: může se řídit pravidly, jako jsou lipofilní rozsahy, omezení struktury, vlastnosti vazebných míst, cíle selektivity JCIM 2024 (difuzní modely v de novo návrhu léčiv) REINVENT 4 (otevřený rámec)
Povědomí o vlastnostech: generuje molekuly, které jsou nejen nové, ale také „ne absurdní“ v termínech ADMET ADMETlab 2.0 (proč je důležitý včasný ADMET)
Hlášení nejistoty: signalizuje, kdy se jedná o odhad oproti tomu, kdy je výsledek spolehlivý (pomáhá i hrubé pásmo spolehlivosti) Principy validace OECD QSAR (oblast použitelnosti)
Řízení s lidským zásahem: chemici mohou rychle řídit, odmítat a usměrňovat výstupy Nature 2023 (pracovní postup + kontext objevovacích technologií)
Sledovatelnost: můžete vidět, proč k návrhu došlo (alespoň částečně), nebo letíte naslepo. Pokyny OECD QSAR (transparentnost modelu + validace)
Vyhodnocovací svazek: dokování, QSAR, filtry, kontroly retrosyntézy - vše zapojené 🔧 Nature 2023 (přehled objevování ligandů) Strojové učení v CASP (Coley 2018)
Kontroly zkreslení a úniků: aby se zabránilo vkrádání se do paměti trénovacích dat (ano, stává se to) USENIX 2021 (extrakce trénovacích dat) Vogt 2023 (obavy s novostí/jedinečností)

Pokud vaše generativní umělá inteligence nezvládá omezení, je to v podstatě generátor novosti. Zábava na večírcích. Méně zábavy v protidrogovém programu.

Kam se generativní umělá inteligence hodí v procesu objevování léků 🧭

Zde je jednoduchá mentální mapa. Generativní umělá inteligence může přispět téměř ke každé fázi, ale nejlépe funguje tam, kde jsou iterace nákladné a prostor pro hypotézy obrovský. Nature 2023 (přehled objevů ligandů)

Běžné kontaktní body:

Objevování a validace cílů (hypotézy, mapování drah, návrhy biomarkerů) Přehled Frontiers in Drug Discovery 2024
Identifikace zásahů (virtuální screening augmentace, generování de novo zásahů) Nature Biotechnology 2019 (GENTRL)
Optimalizace leadů (navrhování analogů, ladění více parametrů) REINVENT 4
Preklinická podpora (predikce vlastností ADMET, někdy i rady ohledně formulace) ADMETlab 2.0
CMC a plánování syntézy (návrhy retrosyntézy, třídění tras) AiZynthFinder 2020 Coley 2017 (počítačem asistovaná retrosyntéza)
Znalostní práce (syntéza literatury, shrnutí konkurenčního prostředí) 📚 Patterns 2025 (LLM v oblasti objevování léčiv)

V mnoha programech plynou největší výhry z integrace pracovních postupů, nikoli z toho, že jeden model je „geniální“. Model je motor – potrubí je auto. Nature 2023 (přehled objevů ligandů)

Srovnávací tabulka: populární generativní přístupy umělé inteligence používané při objevování léků 📊

Trochu nedokonalý stůl, protože skutečný život je trochu nedokonalý.

Nástroj / Přístup	Nejlepší pro (publikum)	Cena přibližná	Proč to funguje (a kdy ne)
Generátory molekul de novo (SMILES, grafy)	Lékařská chemie + kombinovaná chemie	$$-$$$	Skvělý v rychlém objevování nových analogů 😎 - ale dokáže odhalit nestabilní neshody REINVENT 4 GENTRL (Nature Biotech 2019)
Generátory proteinů / struktur	Biologické týmy, strukturní biologie	$$$	Pomáhá navrhovat sekvence + struktury - ale „vypadá věrohodně“ není totéž co „funguje“ AlphaFold (Nature 2021) RFdiffusion (Nature 2023)
Molekulární design ve stylu difuze	Pokročilé týmy strojového učení	$$-$$$$	Silný v podmiňování omezeními a diverzitě - nastavení může být… celá věc JCIM 2024 (difuzní modely) PMC 2025 difuzní přehled
Kopiloti pro predikci nemovitostí (kombinace QSAR + GenAI)	DMPK, projektové týmy	$$	Dobré pro třídění a hodnocení - špatné, pokud se s tím zachází jako s evangeliem 😬 OECD (oblast použitelnosti) ADMETlab 2.0
Plánovači retrosyntézy	Procesní chemie, CMC	$$-$$$	Zrychluje vytváření nápadů na trasy – pro proveditelnost a bezpečnost stále potřebuje lidi AiZynthFinder 2020 Coley 2018 (CASP)
Multimodální laboratorní kopiloti (text + data testů)	Překladatelské týmy	$$$	Užitečné pro přenos signálů napříč datovými sadami - náchylné k přehnané sebedůvěře, pokud jsou data nekonzistentní Nature 2024 (dávkové efekty v buněčném zobrazování) npj Digital Medicine 2025 (multimodální v biotechnologii)
Asistenti pro literaturu a hypotézy	Všichni v praxi	$	Hodně zkracuje čas čtení – ale halucinace mohou být kluzké, jako mizející ponožky. Vzory 2025 (LLM v objevování léčiv) Průvodce pro klinické lékaře (halucinace)
Zakázkové modely základů na míru	Velké farmaceutické společnosti, dobře financované biotechnologické firmy	$$$$	Nejlepší ovládání + integrace - také drahé a pomalé na sestavení (omlouvám se, je to pravda) Recenze Frontiers in Drug Discovery 2024

Poznámky: Ceny se značně liší v závislosti na rozsahu, výpočetním výkonu, licencování a na tom, zda váš tým chce „plug and play“ nebo „postavme si vesmírnou loď“

Bližší pohled: Generativní umělá inteligence pro objevování hitů a de novo design 🧩

Toto je hlavní případ použití: generování kandidátních molekul od nuly (nebo z konstrukce), které odpovídají cílovému profilu. Nature Biotechnology 2019 (GENTRL) REINVENT 4

Jak to obvykle funguje v praxi:

Definovat omezení
- cílová třída, tvar vazebné kapsy, známé ligandy
- rozsahy vlastností (rozpustnost, logP, PSA atd.) Lipinski (kontext pravidla 5)
- omezení novosti (vyhněte se známým IP zónám) 🧠 Vogt 2023 (hodnocení novosti)
Generování kandidátů
- skákání po lešení
- růst fragmentů
- návrhy na „vyzdobení tohoto jádra“
- vícekriteriální generování (vazebné + propustné + netoxické) REINVENT 4 Elsevier 2024 recenze (generativní modely)
Agresivně filtrujte
- pravidla lékařské chemie
- PAINS a reaktivní skupinové filtry Baell & Holloway 2010 (PAINS)
- kontroly syntetizovatelnosti AiZynthFinder 2020
- dokování / bodování (nedokonalé, ale užitečné) Nature 2023 (přehled objevů ligandů)
Vyberte malou sadu pro syntézu
- lidé si stále vybírají, protože někdy cítí nesmysly

Trapná pravda: hodnota nespočívá jen v „nových molekulách“. Jsou to nové molekuly, které dávají smysl pro omezení vašeho programu. Ta poslední část je všechno. Nature 2023 (recenze objevu ligandů)

Také mírné přehánění: když se to udělá dobře, může to vypadat, jako byste najali tým neúnavných juniorních chemiků, kteří nikdy nespí a nikdy si nestěžují. Na druhou stranu také nechápou, proč je konkrétní ochranná strategie noční můrou, takže… rovnováha 😅.

Bližší pohled: Optimalizace leadů s generativní umělou inteligencí (multi-parametrické ladění) 🎛️

Optimalizace leadů je bod, kde se sny komplikují.

Chcete:

zvýšení účinnosti
selektivita nahoru
metabolická stabilita
rozpustnost nahoru
bezpečnostní signály dolů
propustnost „tak akorát“
A stále syntetizovatelné

Toto je klasická vícekriteriální optimalizace. Generativní umělá inteligence je neobvykle dobrá v navrhování sady kompromisních řešení, spíše než v předstírání, že existuje jedna dokonalá směs. Recenze REINVENT 4 Elsevier 2024 (generativní modely)

Praktické způsoby, jak to týmy používají:

Analogický návrh: „Vyrobte 30 variant, které sníží clearance, ale zachovají účinnost“
Substituční skenování: řízené prozkoumávání místo hrubé síly
Scaffold hopping: když jádro narazí na zeď (tox, IP nebo stabilita)
Návrhy na vysvětlení: „Tato polární skupina může zlepšit rozpustnost, ale mohla by zhoršit propustnost“ (ne vždy správné, ale užitečné)

Jedno upozornění: prediktory vlastností mohou být křehké. Pokud vaše trénovací data neodpovídají vaší chemické řadě, model se může s jistotou mýlit. Jako velmi mýlit. A nebude se stydět. Principy validace OECD QSAR (oblast použitelnosti) Weaver 2008 (oblast použitelnosti QSAR)

Bližší pohled: ADMET, toxicita a screening „prosím, nezabíjejte program“ 🧯

ADMET je oblast, kde mnoho kandidátů tiše selhává. Generativní umělá inteligence sice neřeší biologii, ale může snížit počet chyb, kterým se lze vyhnout. ADMETlab 2.0 Waring 2015 (úbytek)

Běžné role:

predikce metabolických zátěží (místa metabolismu, trendy clearance)
označování pravděpodobných motivů toxicity (upozornění, zástupné ukazatele reaktivních meziproduktů)
odhad rozsahů rozpustnosti a propustnosti
navrhuje modifikace ke snížení rizika hERG nebo ke zlepšení stability 🧪 FDA (ICH E14/S7B otázky a odpovědi) EMA (přehled ICH E14/S7B)

Nejefektivnější vzorec obvykle vypadá takto: k navrhování možností použít GenAI, ale k ověření použít specializované modely a experimenty.

Generativní umělá inteligence je motorem tvorby nápadů. Validace stále existuje v testech.

Bližší pohled: Generativní umělá inteligence pro biologická léčiva a proteinové inženýrství 🧬✨

Objevování léků se netýká jen malých molekul. Generativní umělá inteligence se používá také k:

generování sekvence protilátek
návrhy na zrání afinity
zlepšení stability proteinů
enzymové inženýrství
průzkum peptidové terapie ProteinMPNN (Věda 2022) Rives 2021 (modely proteinového jazyka)

Generování proteinů a sekvencí může být účinné, protože „jazyk“ sekvencí se překvapivě dobře mapuje na metody strojového učení. Ale tady je nenápadný návrat: mapuje se dobře… dokud se to nestane. Protože imunogenicita, exprese, glykosylační vzorce a omezení vývoje mohou být brutální. AlphaFold (Nature 2021) ProteinGenerator (Nat Biotech 2024)

Mezi nejlepší nastavení tedy patří:

filtry vývoje
skóre rizika imunogenity
omezení vyrobitelnosti
mokré laboratorní smyčky pro rychlou iteraci 🧫

Pokud je vynecháte, získáte nádhernou sekvenci, která se v produkci chová jako diva.

Bližší pohled: Plánování syntézy a návrhy retrosyntézy 🧰

Generativní umělá inteligence se vkrádá i do chemických operací, nejen do tvorby molekul.

Plánovači retrosyntézy mohou:

navrhnout cesty k cílové sloučenině
navrhnout komerčně dostupné výchozí materiály
seřadit trasy podle počtu kroků nebo vnímané proveditelnosti
pomozte chemikům rychle vyloučit „roztomilé, ale nemožné“ nápady AiZynthFinder 2020 Coley 2018 (CASP)

To může ušetřit reálný čas, zejména při zkoumání mnoha kandidátských struktur. Přesto zde na lidech hodně záleží, protože:

změny dostupnosti činidel
Obavy z bezpečnosti a rozsahu jsou reálné
Některé kroky vypadají na papíře dobře, ale opakovaně selhávají

Není to úplně dokonalá metafora, ale stejně ji použiji: retrosyntéza umělé inteligence je jako GPS, která má většinou pravdu, až na to, že vás někdy navede přes jezero a trvá na tom, že je to zkratka. 🚗🌊 Coley 2017 (počítačem asistovaná retrosyntéza)

Data, multimodální modely a drsná realita laboratoří 🧾🧪

Generativní umělá inteligence miluje data. Laboratoře produkují data. Na papíře to zní jednoduše.

Ha. Ne.

Skutečná laboratorní data jsou:

neúplný
hlučný
plný dávkových efektů Leek a kol. 2010 (dávkové efekty) Nature 2024 (dávkové efekty v buněčném zobrazování)
rozptýlené napříč formáty
požehnaný „kreativními“ konvencemi pojmenování

Multimodální generativní systémy mohou kombinovat:

výsledky testů
chemické struktury
snímky (mikroskopie, histologie)
omika (transkriptomika, proteomika)
text (protokoly, ELN, zprávy) npj Digitální medicína 2025 (multimodální v biotechnologiích) Analýza lékařského obrazu 2025 (multimodální umělá inteligence v medicíně)

Když to funguje, je to úžasné. Můžete odhalit skryté vzorce a navrhnout experimenty, které by jeden specialista mohl přehlédnout.

Když to selže, selže to tiše. Nepráskne to dveřmi. Jen vás to postrčí k sebevědomému chybnému závěru. Proto nejsou řízení, validace a kontrola domény volitelné. Průvodce pro klinické lékaře (halucinace) npj Digital Medicine 2025 (halucinace + bezpečnostní rámec)

Rizika, omezení a sekce „nenechte se zmást plynulým výstupem“ ⚠️

Pokud si pamatujete jen jednu věc, pamatujte si toto: generativní umělá inteligence je přesvědčivá. Může znít správně, ale zároveň být špatně. Průvodce pro lékaře (halucinace)

Klíčová rizika:

Halucinační mechanismy: věrohodná biologie, která není skutečná. Průvodce pro lékaře (halucinace).
Únik dat: generování něčeho příliš blízkého známým sloučeninám USENIX 2021 (extrakce trénovacích dat) Vogt 2023 (obavy z novosti/jedinečnosti)
Nadměrná optimalizace: honba za předpokládanými výsledky, které se in vitro nepřekládají Nature 2023 (přehled objevů ligandů)
Zkreslení: tréninková data vychýlená směrem k určitým chemotypům nebo cílům Vogt 2023 (hodnocení modelu + zkreslení/novost)
Falešná novost: „nové“ molekuly, které jsou ve skutečnosti triviálními variantami Vogt 2023
Mezery ve vysvětlitelnosti: obtížné odůvodnit rozhodnutí pro zúčastněné strany. Zásady validace QSAR OECD.
Bezpečnostní a IP obavy: citlivé detaily programu v pokynech 😬 USENIX 2021 (extrakce dat pro školení)

Zmírňující opatření, která pomáhají v praxi:

udržovat lidi v rozhodovacím cyklu
výzvy a výstupy protokolů pro sledovatelnost
validovat ortogonálními metodami (testy, alternativní modely)
automaticky vynucovat omezení a filtry
zacházejte s výstupy jako s hypotézami, nikoli s tabulkami pravdivosti – pokyny OECD pro QSAR

Generativní umělá inteligence je elektrický nástroj. Elektrické nářadí z vás neudělá tesaře… jen dělá chyby rychleji, pokud nevíte, co děláte.

Jak týmy zavádějí generativní umělou inteligenci bez chaosu 🧩🛠️

Týmy to často chtějí využít, aniž by z organizace udělaly vědecký veletrh. Praktická cesta k přijetí vypadá takto:

Začněte s jedním úzkým hrdlem (rozšíření zásahu, generování analogů, třídění literatury) Nature 2023 (přehled objevů ligandů)
Vytvořte těsnou vyhodnocovací smyčku (filtry + dokování + kontroly vlastností + chemická revize) REINVENT 4 AiZynthFinder 2020
Měření výsledků (ušetřený čas, míra úspěšnosti, snížení úbytku zaměstnanců) Waring 2015 (úbytek zaměstnanců)
Integrace se stávajícími nástroji (ELN, registr sloučenin, databáze testů) Zdroj Edinburgh ELN
Vytvoření pravidel použití (co lze vyzvat, co zůstat offline, kroky kontroly) USENIX 2021 (riziko extrakce dat)
Školte lidi jemně (vážně, většina chyb vzniká nesprávným použitím, nikoli modelem). Průvodce pro klinické lékaře (halucinace)

Také nepodceňujte kulturu. Pokud mají chemici pocit, že jim je umělá inteligence vnucována, budou ji ignorovat. Pokud jim to ušetří čas a bude respektovat jejich odbornost, rychle si ji osvojí. Lidé jsou v tomhle legrační 🙂.

Jaká je role generativní umělé inteligence při objevování léků při oddálení? 🔭

Při menším zvážení se nejedná o „nahrazení vědců“. Jde o „rozšíření vědeckého záběru“. Nature 2023 (přehled objevů ligandů)

Pomáhá týmům:

prozkoumávat více hypotéz týdně
navrhnout více kandidátských struktur za cyklus
inteligentněji upřednostňovat experimenty
komprimovat iterační smyčky mezi návrhem a testováním
sdílejte znalosti napříč oddělenými platformami Patterns 2025 (LLM v oblasti objevování léčiv)

A možná nejvíce podceňovaná část: pomáhá vám to neplýtvat drahou lidskou kreativitou na opakující se úkoly. Lidé by měli přemýšlet o mechanismu, strategii a interpretaci – ne trávit dny ručním generováním seznamů variant. Nature 2023 (přehled objevů ligandů)

Takže ano, role generativní umělé inteligence v objevování léků je akcelerátor, generátor, filtr a někdy i problémový faktor. Ale cenná.

Závěrečné shrnutí 🧾✅

Generativní umělá inteligence se stává klíčovou schopností v moderním objevování léků, protože dokáže generovat molekuly, hypotézy, sekvence a trasy rychleji než lidé – a může týmům pomoci vybrat lepší experimenty. Přehled Frontiers in Drug Discovery 2024, Nature 2023 (přehled objevování ligandů).

Souhrnné odrážky:

Nejlepší je pro včasné objevování a optimalizaci leadů ⚙️ REINVENT 4
Podporuje malé molekuly a biologické látky GENTRL (Nature Biotech 2019) ProteinMPNN (Science 2022)
Zvyšuje produktivitu rozšířením nápadového trychtýře. Nature 2023 (přehled objevů ligandů).
Potřebuje omezení, validaci a lidi, aby se zabránilo sebevědomým nesmyslům. Principy OECD QSAR. Průvodce pro klinické lékaře (halucinace).
Největší výhry plynou z integrace pracovních postupů, nikoli z marketingové pěny. Nature 2023 (recenze objevu ligandů)

Pokud s ním budete zacházet jako se spolupracovníkem – ne jako s věštbou – může skutečně posouvat programy vpřed. A pokud s ním budete zacházet jako s věštbou… no, můžete skončit tak, že budete zase sledovat tu GPS do jezera.

Příklad z reálného světa: Vytvoření pracovního postupu generování molekul s omezeními 🧪

Scénář

Fiktivní, ale realistický malý biotechnologický tým pracuje na cíli pro zánětlivé onemocnění. Již mají 42 potvrzených slabých shod ze screeningu, ale většina z nich má špatnou rozpustnost a několik z nich se nachází příliš blízko konkurenčního patentového prostoru.

Místo aby tým po generativním modelu žádal, aby „našel lepší molekuly“ – což je v podstatě výzva k přijetí elegantního nesmyslu – vybudoval si striktní pracovní postup pro rozšíření hitů.

Cíl je jednoduchý: vygenerovat širší sadu analogů, důkladně je filtrovat a poslat k posouzení v rámci medicínské chemie pouze ty nejobhajitelnější kandidáty.

Co asistent potřebuje

Tým poskytuje systému:

cílový profil a informace o známém ligandu

42 potvrzených zásahů v budovách

limity vlastností pro molekulovou hmotnost, logP, TPSA, rozpustnost a předpokládanou clearance

blokované scaffoldy a prahové hodnoty podobnosti pro vyhýbání se IP adresám

PAINS a reaktivní skupinové filtry Baell & Holloway 2010

Predikce ADMET kontroluje ADMETlab 2.0

kontroly proveditelnosti retrosyntézy AiZynthFinder 2020

pravidla lidské kontroly pro konečný výběr

Důležité je, že model se nesmí sám optimalizovat pro účinnost. Musí vyvažovat účinnost, novost, vývojářskou schopnost a syntetizovatelnost.

Příklad instrukce

Na základě těchto potvrzených struktur vygenerujte 150 analogických nápadů. Udržujte molekulovou hmotnost mezi 300 a 480, předpokládaný logP mezi 1,5 a 4,0, TPSA pod 110 a vyhněte se blokovaným strukturám uvedeným v souboru IP. Upřednostněte struktury bez upozornění PAINS, bez zjevných reaktivních skupin a s věrohodnou syntetickou cestou o pěti nebo méně krocích. U každé molekuly vysvětlete hlavní modifikaci, zamýšlené zlepšení vlastností, klíčové riziko a to, zda by sloučenina měla být zamítnuta, přezkoumána nebo upřednostněna.

Jak to otestovat

Tým nedůvěřuje prvnímu výstupu. Spustí krátkou vyhodnocovací smyčku:

Zkontrolujte, zda generované molekuly splňují omezení vlastností

Odstraňte téměř duplikáty a struktury příliš blízké známým sloučeninám

Spusťte filtry PAINS, reaktivní skupiny a základní medicinální chemie

Spusťte druhý model nemovitosti pro porovnání predikcí ADMET

Požádejte dva chemiky, aby nezávisle na sobě ohodnotili 30 nejlepších kandidátů

Do syntézní diskuse odeslat pouze užší výběr s nejvyšším skóre

Cenná testovací otázka zní: „Zvažovali bychom tuto molekulu i nadále, kdyby ji umělá inteligence nenavrhla?“

Když je odpověď ne, tým se ptá proč. Někdy to odhalí dobrý nový nápad. Jindy to odhalí zbožné přání řízené modelem.

Výsledek

Pouze ilustrativní výsledek – nejedná se o případovou studii reálné společnosti.

Na základě načasování tří vzorových úloh expanze shody trvalo manuální pracovní postup vytvoření a třídění 60 analogových nápadů přibližně 5 hodin. Pracovní postup GenAI s omezeními v první řadě vytvořil 150 počátečních kandidátů za přibližně 55 minut.

Po filtrování přežilo celou screeningovou proceduru pouze 27 kandidátů. Z nich chemici označili 9 jako hodné hlubšího posouzení, 12 jako „zajímavé, ale riskantní“ a 6 jako odmítnuté při posouzení.

To znamená, že cenným výstupem nebylo „150 nových molekul“. Cenným výstupem bylo 9 posouditelných kandidátů za méně než 1 hodinu s jasnou auditní stopou ukazující, která omezení každý kandidát splnil nebo nesplnil.

Tým by to mohl ověřit sledováním:

čas strávený v jednom návrhovém cyklu

počet generovaných struktur

procento odstraněné filtry

míra přijetí chemiků

počet kandidátů vybraných pro syntézu

číslo později potvrzeno jako aktivní v testu

Co se může pokazit

Model se může optimalizovat podle filtrů, místo aby navrhoval skutečně zdravou chemii.

Kandidát může vypadat skvěle v předpokládaném ADMET, ale v reálném testu okamžitě selhat. Principy validace OECD QSAR

Návrhy retrosyntézy se mohou zdát věrohodné, i když se spoléhají na nedostupná činidla, nepříjemné podmínky nebo nebezpečnou chemii.

Filtr novosti může příliš agresivně odstraňovat hodnotné sloučeniny nebo propouštět molekuly, které jsou stále příliš blízko známému IP.

Největší chybou je zacházet se seznamem seřazených podle priorit jako s pravdou. Je to pouze seznam hypotéz seřazených podle priorit.

Praktické ponaučení

Nejlepším praktickým využitím generativní umělé inteligence při objevování léků není „stiskněte tlačítko, dostanete lék“. Je to kontrolovaná továrna na nápady: generujte široce, brutálně filtrujte, dokumentujte každé rozhodnutí a nechte vědce učinit konečné rozhodnutí.

Často kladené otázky

Jaká je role generativní umělé inteligence ve vývoji léků?

Generativní umělá inteligence primárně rozšiřuje cestu k novým nápadům a optimalizaci potenciálních zákazníků tím, že navrhuje kandidátní molekuly, proteinové sekvence, syntetické cesty a biologické hypotézy. Její hodnota spočívá méně v „nahrazování experimentů“ a více ve „výběru lepších experimentů“ generováním mnoha možností a jejich následným důkladným filtrováním. Nejlépe funguje jako akcelerátor v rámci disciplinovaného pracovního postupu, nikoli jako samostatný rozhodovací orgán.

Kde si generativní umělá inteligence vede nejlépe v rámci celého procesu vývoje léků?

Obvykle přináší největší hodnotu tam, kde je prostor pro hypotézy obrovský a iterace je nákladná, jako je identifikace shod, de novo návrh a optimalizace potenciálních zákazníků. Týmy jej také používají pro třídění ADMET, návrhy retrosyntézy a podporu literatury nebo hypotéz. Největší zisky obvykle plynou z integrace generování s filtry, bodováním a lidskou kontrolou, spíše než z očekávání, že jeden model bude „chytrý“

Jak nastavíte omezení, aby generativní modely neprodukovaly zbytečné molekuly?

Praktickým přístupem je definovat omezení před generováním: rozsahy vlastností (jako je rozpustnost nebo cílové hodnoty logP), pravidla pro scaffold nebo substrukturu, vlastnosti vazebných míst a limity novosti. Poté se vynucují filtry medicinální chemie (včetně PAINS/reaktivních skupin) a kontroly syntetizovatelnosti. Generování s omezeními je obzvláště užitečné u molekulárního designu difuzního typu a frameworků, jako je REINVENT 4, kde lze kódovat víceúčelové cíle.

Jak by měly týmy ověřovat výstupy GenAI, aby se vyhnuly halucinacím a přehnané sebedůvěře?

Každý výstup zacházejte s hypotézou, nikoli se závěrem, a ověřujte jej pomocí testů a ortogonálních modelů. Generování párů s agresivním filtrováním, dokováním nebo bodováním, kde je to vhodné, a kontrolami aplikovatelnosti prediktorů ve stylu QSAR. Pokud je to možné, zviditelněte nejistotu, protože modely se mohou s jistotou mýlit v chemii mimo distribuci nebo v nejistých biologických tvrzeních. Kontrola „human-in-the-loop“ zůstává klíčovým bezpečnostním prvkem.

Jak můžete zabránit úniku dat, riziku IP a „uloženým“ výstupům?

Používejte řízení a kontroly přístupu, aby citlivé detaily programu nebyly náhodně vkládány do výzev, a výzvy/výstupy zaznamenávejte pro účely auditu. Vynucujte kontroly novosti a podobnosti, aby generovaní kandidáti nebyli příliš blízko známých sloučenin nebo chráněných oblastí. Dodržujte jasná pravidla o tom, jaká data jsou povolena v externích systémech, a pro práci s vysokou citlivostí upřednostňujte kontrolované prostředí. Lidská kontrola pomáhá včas odhalit „příliš známé“ návrhy.

Jak se generativní umělá inteligence používá pro optimalizaci leadů a ladění více parametrů?

V optimalizaci potenciálních zákazníků je generativní umělá inteligence cenná, protože dokáže navrhnout více kompromisních řešení namísto honění se za jedinou „dokonalou“ sloučeninou. Mezi běžné pracovní postupy patří návrh analogů, řízené skenování substituentů a přeskakování mezi scaffoldy, když omezení účinnosti, toxicity nebo IP blokují pokrok. Prediktory vlastností mohou být křehké, takže týmy obvykle seřazují kandidáty pomocí více modelů a poté experimentálně potvrzují nejlepší možnosti.

Může generativní umělá inteligence pomoci i s biologickými látkami a proteinovým inženýrstvím?

Ano – týmy jej používají pro generování sekvencí protilátek, nápady na afinitní zrání, zlepšení stability a průzkum enzymů nebo peptidů. Generování proteinů/sekvencí může vypadat věrohodně, aniž by bylo vyvinuto, proto je důležité aplikovat filtry vývoje, imunogenicity a vyrobitelnosti. Strukturální nástroje jako AlphaFold mohou podpořit uvažování, ale „věrohodná struktura“ stále není důkazem exprese, funkce nebo bezpečnosti. Smyčky v mokré laboratoři zůstávají nezbytné.

Jak generativní umělá inteligence podporuje plánování syntézy a retrosyntézu?

Plánovači retrosyntézy mohou navrhovat trasy, výchozí materiály a pořadí tras, aby urychlili generování nápadů a rychle vyloučili neproveditelné cesty. Nástroje a přístupy, jako je plánování ve stylu AiZynthFinder, jsou nejúčinnější, když jsou spojeny s kontrolami proveditelnosti v reálném světě od chemiků. Dostupnost, bezpečnost, omezení škálování a „papírové reakce“, které v praxi selhávají, stále vyžadují lidský úsudek. Použití tohoto způsobu šetří čas, aniž by se předstíralo, že chemie je vyřešena.

Reference

Nature - Přehled objevů ligandů (2023) - nature.com
Přírodní biotechnologie - GENTRL (2019) - nature.com
Příroda - AlphaFold (2021) - nature.com
Příroda - RFdifúze (2023) - nature.com
Přírodní biotechnologie - Generátor proteinů (2024) - nature.com
Nature Communications - Dávkové efekty v buněčném zobrazování (2024) - nature.com
npj digitální medicína - halucinace + bezpečnostní rámec (2025) - nature.com
npj Digitální medicína - Multimodální v biotechnologiích (2025) - nature.com
Věda - ProteinMPNN (2022) - science.org
Cell Patterns - LLM v oblasti objevování léčiv (2025) - cell.com
ScienceDirect (Elsevier) - Generativní modely v de novo návrhu léčiv (2024) - sciencedirect.com
ScienceDirect (Elsevier) - Vogt (2023): obavy ohledně novosti/jedinečnosti - sciencedirect.com
Analýza lékařských obrazů (ScienceDirect) - Multimodální umělá inteligence v medicíně (2025) - sciencedirect.com
PubMed Central - Průvodce pro lékaře (riziko halucinací) - nih.gov
Účty chemického výzkumu (publikace ACS) - Chemický prostor (2015) - acs.org
PubMed Central - Irwin & Shoichet (2009): chemická prostorová škála - nih.gov
Frontiers in Drug Discovery (PubMed Central) - Recenze (2024) - nih.gov
Journal of Chemical Information and Modeling (ACS Publications) - Difuzní modely v de novo návrhu léčiv (2024) - acs.org
PubMed Central - REINVENT 4 (otevřený rámec) - nih.gov
PubMed Central - ADMETlab 2.0 (rané verze ADMET) - nih.gov
OECD - Zásady pro validaci modelů (Q)SAR pro regulační účely - oecd.org
OECD - Pokyny k validaci modelů (Q)SAR - oecd.org
Účty chemického výzkumu (publikace ACS) - Počítačem podporované plánování syntézy / CASP (Coley, 2018) - acs.org
ACS Central Science (ACS Publications) - Počítačem asistovaná retrosyntéza (Coley, 2017) - acs.org
PubMed Central - AiZynthFinder (2020) - nih.gov
PubMed - Lipinski: Pravidlo 5 kontext - nih.gov
Journal of Medicinal Chemistry (publikace ACS) - Baell & Holloway (2010): PAINS - acs.org
PubMed - Waring (2015): úbytek - nih.gov
PubMed - Rives (2021): modely proteinového jazyka - nih.gov
PubMed Central - Leek a kol. (2010): účinky dávkového testování - nih.gov
PubMed Central - Přehled Diffusion (2025) - nih.gov
FDA - E14 a S7B: klinické a neklinické hodnocení prodloužení intervalu QT/QTc a proarytmického potenciálu (Q&A) - fda.gov
Evropská agentura pro léčivé přípravky - přehled směrnice ICH E14/S7B - europa.eu
USENIX - Carlini a kol. (2021): extrakce trénovacích dat z jazykových modelů - usenix.org
Univerzita v Edinburghu – Digitální výzkumné služby – Zdroj elektronických laboratorních sešitů (ELN) – ed.ac.uk
ScienceDirect (Elsevier) - Weaver (2008): Oblast použitelnosti QSAR - sciencedirect.com

Najděte nejnovější AI v oficiálním obchodě s AI asistenty

O nás

Zpět na blog