Stručná odpověď: Generativní umělá inteligence urychluje především časný objev léků generováním kandidátních molekul nebo proteinových sekvencí, navrhováním syntetických cest a vynášením testovatelných hypotéz, takže týmy mohou provádět méně „slepých“ experimentů. Nejlépe funguje, když vynucujete přísná omezení a ověřujete výstupy; pokud je brána jako věštba, může s jistotou zavádět.
Klíčové poznatky:
Zrychlení : Využijte GenAI k rozšíření generování nápadů a poté je zúžte pomocí důkladného filtrování.
Omezení : Před generováním vyžadovat rozsahy vlastností, pravidla generování a limity novosti.
Validace : Výstupy považovat za hypotézy; potvrdit je pomocí testů a ortogonálních modelů.
Sledovatelnost : Zaznamenávejte výzvy, výstupy a zdůvodnění, aby rozhodnutí zůstala auditovatelná a kontrolovatelná.
Odolnost proti zneužití : Zabraňte únikům informací a přehnané sebedůvěře pomocí správy, kontrol přístupu a lidské kontroly.

Články, které byste si mohli po tomto přečíst:
🔗 Role umělé inteligence ve zdravotnictví
Jak umělá inteligence zlepšuje diagnostiku, pracovní postupy, péči o pacienty a výsledky.
🔗 Nahradí umělá inteligence radiology?
Zkoumá, jak automatizace rozšiřuje radiologii a co zůstává lidské.
🔗 Nahradí umělá inteligence lékaře?
Upřímný pohled na dopad umělé inteligence na práci a praxi lékařů.
🔗 Nejlepší nástroje umělé inteligence pro vědecké objevy
Špičkové nástroje pro laboratoře umělé inteligence pro urychlení experimentů, analýz a objevů.
Role generativní umělé inteligence při objevování léků, jedním dechem 😮💨
Generativní umělá inteligence pomáhá farmaceutickým týmům vytvářet kandidátní molekuly, předpovídat vlastnosti, navrhovat modifikace, navrhovat syntetické cesty, zkoumat biologické hypotézy a zkracovat iterační cykly – zejména v raných fázích objevování a optimalizace potenciálních produktů. Nature 2023 (přehled objevování ligandů) Elsevier 2024 (generativní modely v de novo návrhu léčiv)
A ano, dokáže také s jistotou generovat nesmysly. To je součástí dohody. Jako velmi nadšený stážista s raketovým motorem. Průvodce pro lékaře (riziko halucinací) npj Digital Medicine 2025 (halucinace + bezpečnostní rámec)
Proč je to důležité víc, než si lidé připouštějí 💥
Spousta objevitelské práce je vlastně „hledání“. Hledejte v chemickém prostoru, v biologii, v literatuře, v vztazích mezi strukturou a funkcí. Problém je v tom, že chemický prostor je… v podstatě nekonečný. Accounts of Chemical Research 2015 (chemický prostor) Irwin & Shoichet 2009 (měřítko chemického prostoru)
Mohli byste strávit několik životů jen zkoušením „rozumných“ variant.
Generativní umělá inteligence posouvá pracovní postup z:
-
„Pojďme vyzkoušet, co nás napadne“
na:
-
„Vygenerujme větší a chytřejší sadu možností a pak otestujme ty nejlepší.“
Nejde o vyloučení experimentů. Jde o výběr lepších experimentů . 🧠 Nature 2023 (přehled objevů ligandů)
Také, a o tom se málo diskutuje, pomáhá to týmům komunikovat napříč obory . Chemici, biologové, lidé z DMPK, počítačoví vědci… každý má jiné mentální modely. Slušný generativní systém může sloužit jako sdílený skicák. Recenze Frontiers in Drug Discovery 2024
Co dělá dobrou verzi generativní umělé inteligence pro objevování léků? ✅
Ne všechna generativní umělá inteligence je si rovna. „Dobrá“ verze pro tento prostor se méně točí kolem okázalých ukázek a více kolem neatraktivní spolehlivosti (neatraktivní je zde ctnost). Nature 2023 (recenze objevu ligandů)
Dobré nastavení generativní umělé inteligence má obvykle:
-
Uzemnění domény : trénováno nebo adaptováno na chemická, biologická a farmakologická data (nejen obecný text) 🧬 Recenze Elsevier 2024 (generativní modely)
-
Omezení – první generace : může se řídit pravidly, jako jsou lipofilní rozsahy, omezení struktury, vlastnosti vazebných míst, cíle selektivity JCIM 2024 (difuzní modely v de novo návrhu léčiv) REINVENT 4 (otevřený rámec)
-
Povědomí o vlastnostech : generuje molekuly, které jsou nejen nové, ale také „ne absurdní“ v termínech ADMET ADMETlab 2.0 (proč je důležitý včasný ADMET)
-
Hlášení nejistoty : signalizuje, kdy se jedná o odhad oproti tomu, kdy je výsledek spolehlivý (pomáhá i hrubé pásmo spolehlivosti) Principy validace OECD QSAR (oblast použitelnosti)
-
Řízení s lidským zásahem : chemici mohou rychle řídit, odmítat a usměrňovat výstupy Nature 2023 (pracovní postup + kontext objevovacích technologií)
-
Sledovatelnost : můžete vidět, proč k návrhu došlo (alespoň částečně), nebo letíte naslepo. Pokyny OECD QSAR (transparentnost modelu + validace)
-
Vyhodnocovací svazek : dokování, QSAR, filtry, kontroly retrosyntézy - vše zapojené 🔧 Nature 2023 (přehled objevování ligandů) Strojové učení v CASP (Coley 2018)
-
Kontroly zkreslení a úniků : aby se zabránilo vkrádání se do paměti trénovacích dat (ano, stává se to) USENIX 2021 (extrakce trénovacích dat) Vogt 2023 (obavy s novostí/jedinečností)
Pokud vaše generativní umělá inteligence nezvládá omezení, je to v podstatě generátor novosti. Zábava na večírcích. Méně zábavy v protidrogovém programu.
Kam se generativní umělá inteligence hodí v procesu objevování léků 🧭
Zde je jednoduchá mentální mapa. Generativní umělá inteligence může přispět téměř ke každé fázi, ale nejlépe funguje tam, kde jsou iterace nákladné a prostor pro hypotézy obrovský. Nature 2023 (přehled objevů ligandů)
Běžné kontaktní body:
-
Objevování a validace cílů (hypotézy, mapování drah, návrhy biomarkerů) Přehled Frontiers in Drug Discovery 2024
-
Identifikace zásahů (virtuální screening augmentace, generování de novo zásahů) Nature Biotechnology 2019 (GENTRL)
-
Optimalizace leadů (navrhování analogů, ladění více parametrů) REINVENT 4
-
Preklinická podpora (predikce vlastností ADMET, někdy i rady ohledně formulace) ADMETlab 2.0
-
CMC a plánování syntézy (návrhy retrosyntézy, třídění tras) AiZynthFinder 2020 Coley 2017 (počítačem asistovaná retrosyntéza)
-
Znalostní práce (syntéza literatury, shrnutí konkurenčního prostředí) 📚 Patterns 2025 (LLM v oblasti objevování léčiv)
V mnoha programech plynou největší výhry z integrace pracovních postupů , nikoli z toho, že jeden model je „geniální“. Model je motor – potrubí je auto. Nature 2023 (přehled objevů ligandů)
Srovnávací tabulka: populární generativní přístupy umělé inteligence používané při objevování léků 📊
Trochu nedokonalý stůl, protože skutečný život je trochu nedokonalý.
| Nástroj / Přístup | Nejlepší pro (publikum) | Cena přibližná | Proč to funguje (a kdy ne) |
|---|---|---|---|
| Generátory molekul de novo (SMILES, grafy) | Lékařská chemie + kombinovaná chemie | $$-$$$ | Skvělý v rychlém objevování nových analogů 😎 - ale dokáže odhalit nestabilní neshody REINVENT 4 GENTRL (Nature Biotech 2019) |
| Generátory proteinů / struktur | Biologické týmy, strukturní biologie | $$$ | Pomáhá navrhovat sekvence + struktury - ale „vypadá věrohodně“ není totéž co „funguje“ AlphaFold (Nature 2021) RFdiffusion (Nature 2023) |
| Molekulární design ve stylu difuze | Pokročilé týmy strojového učení | $$-$$$$ | Silný v podmiňování omezeními a diverzitě - nastavení může být… celá věc JCIM 2024 (difuzní modely) PMC 2025 difuzní přehled |
| Kopiloti pro predikci nemovitostí (kombinace QSAR + GenAI) | DMPK, projektové týmy | $$ | Dobré pro třídění a hodnocení - špatné, pokud se s tím zachází jako s evangeliem 😬 OECD (oblast použitelnosti) ADMETlab 2.0 |
| Plánovači retrosyntézy | Procesní chemie, CMC | $$-$$$ | Zrychluje vytváření nápadů na trasy – pro proveditelnost a bezpečnost stále potřebuje lidi AiZynthFinder 2020 Coley 2018 (CASP) |
| Multimodální laboratorní kopiloti (text + data testů) | Překladatelské týmy | $$$ | Užitečné pro přenos signálů napříč datovými sadami - náchylné k přehnané sebedůvěře, pokud jsou data nekonzistentní Nature 2024 (dávkové efekty v buněčném zobrazování) npj Digital Medicine 2025 (multimodální v biotechnologii) |
| Asistenti pro literaturu a hypotézy | Všichni v praxi | $ | Hodně zkracuje čas čtení – ale halucinace mohou být kluzké, jako mizející ponožky. Vzory 2025 (LLM v objevování léčiv) Průvodce pro klinické lékaře (halucinace) |
| Zakázkové modely základů na míru | Velké farmaceutické společnosti, dobře financované biotechnologické firmy | $$$$ | Nejlepší ovládání + integrace - také drahé a pomalé na sestavení (omlouvám se, je to pravda) Recenze Frontiers in Drug Discovery 2024 |
Poznámky: Ceny se značně liší v závislosti na rozsahu, výpočetním výkonu, licencování a na tom, zda váš tým chce „plug and play“ nebo „postavme si vesmírnou loď“
Bližší pohled: Generativní umělá inteligence pro objevování hitů a de novo design 🧩
Toto je hlavní případ použití: generování kandidátních molekul od nuly (nebo z konstrukce), které odpovídají cílovému profilu. Nature Biotechnology 2019 (GENTRL) REINVENT 4
Jak to obvykle funguje v praxi:
-
Definovat omezení
-
cílová třída, tvar vazebné kapsy, známé ligandy
-
rozsahy vlastností (rozpustnost, logP, PSA atd.) Lipinski (kontext pravidla 5)
-
omezení novosti (vyhněte se známým IP zónám) 🧠 Vogt 2023 (hodnocení novosti)
-
-
Generování kandidátů
-
skákání po lešení
-
růst fragmentů
-
návrhy na „vyzdobení tohoto jádra“
-
vícekriteriální generování (vazebné + propustné + netoxické) REINVENT 4 Elsevier 2024 recenze (generativní modely)
-
-
Agresivně filtrujte
-
pravidla lékařské chemie
-
PAINS a reaktivní skupinové filtry Baell & Holloway 2010 (PAINS)
-
kontroly syntetizovatelnosti AiZynthFinder 2020
-
dokování / bodování (nedokonalé, ale užitečné) Nature 2023 (přehled objevů ligandů)
-
-
Vyberte malou sadu pro syntézu
-
lidé si stále vybírají, protože někdy cítí nesmysly
-
Trapná pravda: hodnota nespočívá jen v „nových molekulách“. Jsou to nové molekuly, které dávají smysl pro omezení vašeho programu . Ta poslední část je všechno. Nature 2023 (recenze objevu ligandů)
Také mírné přehánění: když se to udělá dobře, může to vypadat, jako byste najali tým neúnavných juniorních chemiků, kteří nikdy nespí a nikdy si nestěžují. Na druhou stranu také nechápou, proč je konkrétní ochranná strategie noční můrou, takže… rovnováha 😅.
Bližší pohled: Optimalizace leadů s generativní umělou inteligencí (multi-parametrické ladění) 🎛️
Optimalizace leadů je bod, kde se sny komplikují.
Chcete:
-
zvýšení účinnosti
-
selektivita nahoru
-
metabolická stabilita
-
rozpustnost nahoru
-
bezpečnostní signály dolů
-
propustnost „tak akorát“
-
A stále syntetizovatelné
Toto je klasická vícekriteriální optimalizace. Generativní umělá inteligence je neobvykle dobrá v navrhování sady kompromisních řešení, spíše než v předstírání, že existuje jedna dokonalá směs. Recenze REINVENT 4
Praktické způsoby, jak to týmy používají:
-
Analogický návrh : „Vyrobte 30 variant, které sníží clearance, ale zachovají účinnost“
-
Substituční skenování : řízené prozkoumávání místo hrubé síly
-
Scaffold hopping : když jádro narazí na zeď (tox, IP nebo stabilita)
-
Návrhy na vysvětlení : „Tato polární skupina může zlepšit rozpustnost, ale mohla by zhoršit propustnost“ (ne vždy správné, ale užitečné)
Jedno upozornění: prediktory vlastností mohou být křehké. Pokud vaše trénovací data neodpovídají vaší chemické řadě, model se může s jistotou mýlit. Jako velmi mýlit. A nebude se stydět. Principy validace OECD QSAR (oblast použitelnosti) Weaver 2008 (oblast použitelnosti QSAR)
Bližší pohled: ADMET, toxicita a screening „prosím, nezabíjejte program“ 🧯
ADMET je oblast, kde mnoho kandidátů tiše selhává. Generativní umělá inteligence sice neřeší biologii, ale může snížit počet chyb, kterým se lze vyhnout. ADMETlab 2.0 Waring 2015 (úbytek)
Běžné role:
-
predikce metabolických zátěží (místa metabolismu, trendy clearance)
-
označování pravděpodobných motivů toxicity (upozornění, zástupné ukazatele reaktivních meziproduktů)
-
odhad rozsahů rozpustnosti a propustnosti
-
navrhuje modifikace ke snížení rizika hERG nebo ke zlepšení stability 🧪 FDA (ICH E14/S7B otázky a odpovědi) EMA (přehled ICH E14/S7B)
Nejefektivnější vzorec obvykle vypadá takto: k navrhování možností použít GenAI, ale k ověření použít specializované modely a experimenty.
Generativní umělá inteligence je motorem tvorby nápadů. Validace stále existuje v testech.
Bližší pohled: Generativní umělá inteligence pro biologická léčiva a proteinové inženýrství 🧬✨
Objevování léků se netýká jen malých molekul. Generativní umělá inteligence se používá také k:
-
generování sekvence protilátek
-
návrhy na zrání afinity
-
zlepšení stability proteinů
-
enzymové inženýrství
-
průzkum peptidové terapie ProteinMPNN (Věda 2022) Rives 2021 (modely proteinového jazyka)
Generování proteinů a sekvencí může být účinné, protože „jazyk“ sekvencí se překvapivě dobře mapuje na metody strojového učení. Ale tady je nenápadný návrat: mapuje se dobře… dokud se to nestane. Protože imunogenicita, exprese, glykosylační vzorce a omezení vývoje mohou být brutální. AlphaFold (Nature 2021) ProteinGenerator (Nat Biotech 2024)
Mezi nejlepší nastavení tedy patří:
-
filtry vývoje
-
skóre rizika imunogenity
-
omezení vyrobitelnosti
-
mokré laboratorní smyčky pro rychlou iteraci 🧫
Pokud je vynecháte, získáte nádhernou sekvenci, která se v produkci chová jako diva.
Bližší pohled: Plánování syntézy a návrhy retrosyntézy 🧰
Generativní umělá inteligence se vkrádá i do chemických operací, nejen do tvorby molekul.
Plánovači retrosyntézy mohou:
-
navrhnout cesty k cílové sloučenině
-
navrhnout komerčně dostupné výchozí materiály
-
seřadit trasy podle počtu kroků nebo vnímané proveditelnosti
-
pomozte chemikům rychle vyloučit „roztomilé, ale nemožné“ nápady AiZynthFinder 2020 Coley 2018 (CASP)
To může ušetřit reálný čas, zejména při zkoumání mnoha kandidátských struktur. Přesto zde na lidech hodně záleží, protože:
-
změny dostupnosti činidel
-
Obavy z bezpečnosti a rozsahu jsou reálné
-
Některé kroky vypadají na papíře dobře, ale opakovaně selhávají
Není to úplně dokonalá metafora, ale stejně ji použiji: retrosyntéza umělé inteligence je jako GPS, která má většinou pravdu, až na to, že vás někdy navede přes jezero a trvá na tom, že je to zkratka. 🚗🌊 Coley 2017 (počítačem asistovaná retrosyntéza)
Data, multimodální modely a drsná realita laboratoří 🧾🧪
Generativní umělá inteligence miluje data. Laboratoře produkují data. Na papíře to zní jednoduše.
Ha. Ne.
Skutečná laboratorní data jsou:
-
neúplný
-
hlučný
-
plný dávkových efektů Leek a kol. 2010 (dávkové efekty) Nature 2024 (dávkové efekty v buněčném zobrazování)
-
rozptýlené napříč formáty
-
požehnaný „kreativními“ konvencemi pojmenování
Multimodální generativní systémy mohou kombinovat:
-
výsledky testů
-
chemické struktury
-
snímky (mikroskopie, histologie)
-
omika (transkriptomika, proteomika)
-
text (protokoly, ELN, zprávy) npj Digitální medicína 2025 (multimodální v biotechnologiích) Analýza lékařského obrazu 2025 (multimodální umělá inteligence v medicíně)
Když to funguje, je to úžasné. Můžete odhalit skryté vzorce a navrhnout experimenty, které by jeden specialista mohl přehlédnout.
Když to selže, selže to tiše. Nepráskne to dveřmi. Jen vás to postrčí k sebevědomému chybnému závěru. Proto nejsou řízení, validace a kontrola domény volitelné. Průvodce pro klinické lékaře (halucinace) npj Digital Medicine 2025 (halucinace + bezpečnostní rámec)
Rizika, omezení a sekce „nenechte se zmást plynulým výstupem“ ⚠️
Pokud si pamatujete jen jednu věc, pamatujte si toto: generativní umělá inteligence je přesvědčivá. Může znít správně, ale zároveň být špatně. Průvodce pro lékaře (halucinace)
Klíčová rizika:
-
Halucinační mechanismy : věrohodná biologie, která není skutečná. Průvodce pro lékaře (halucinace).
-
Únik dat : generování něčeho příliš blízkého známým sloučeninám USENIX 2021 (extrakce trénovacích dat) Vogt 2023 (obavy z novosti/jedinečnosti)
-
Nadměrná optimalizace : honba za předpokládanými výsledky, které se in vitro nepřekládají Nature 2023 (přehled objevů ligandů)
-
Zkreslení : tréninková data vychýlená směrem k určitým chemotypům nebo cílům Vogt 2023 (hodnocení modelu + zkreslení/novost)
-
Falešná novost : „nové“ molekuly, které jsou ve skutečnosti triviálními variantami Vogt 2023
-
Mezery ve vysvětlitelnosti : obtížné odůvodnit rozhodnutí pro zúčastněné strany. Zásady validace QSAR OECD.
-
Bezpečnostní a IP obavy : citlivé detaily programu v pokynech 😬 USENIX 2021 (extrakce dat pro školení)
Zmírňující opatření, která pomáhají v praxi:
-
udržovat lidi v rozhodovacím cyklu
-
výzvy a výstupy protokolů pro sledovatelnost
-
validovat ortogonálními metodami (testy, alternativní modely)
-
automaticky vynucovat omezení a filtry
-
zacházejte s výstupy jako s hypotézami, nikoli s tabulkami pravdivosti – pokyny OECD pro QSAR
Generativní umělá inteligence je elektrický nástroj. Elektrické nářadí z vás neudělá tesaře… jen dělá chyby rychleji, pokud nevíte, co děláte.
Jak týmy zavádějí generativní umělou inteligenci bez chaosu 🧩🛠️
Týmy to často chtějí využít, aniž by z organizace udělaly vědecký veletrh. Praktická cesta k přijetí vypadá takto:
-
Začněte s jedním úzkým hrdlem (rozšíření zásahu, generování analogů, třídění literatury) Nature 2023 (přehled objevů ligandů)
-
Vytvořte těsnou vyhodnocovací smyčku (filtry + dokování + kontroly vlastností + chemická revize) REINVENT 4 AiZynthFinder 2020
-
Měření výsledků (ušetřený čas, míra úspěšnosti, snížení úbytku zaměstnanců) Waring 2015 (úbytek zaměstnanců)
-
Integrace se stávajícími nástroji (ELN, registr sloučenin, databáze testů) Zdroj Edinburgh ELN
-
Vytvoření pravidel použití (co lze vyzvat, co zůstat offline, kroky kontroly) USENIX 2021 (riziko extrakce dat)
-
Školte lidi jemně (vážně, většina chyb vzniká nesprávným použitím, nikoli modelem). Průvodce pro klinické lékaře (halucinace)
Také nepodceňujte kulturu. Pokud mají chemici pocit, že jim je umělá inteligence vnucována, budou ji ignorovat. Pokud jim to ušetří čas a bude respektovat jejich odbornost, rychle si ji osvojí. Lidé jsou v tomhle legrační 🙂.
Jaká je role generativní umělé inteligence při objevování léků při oddálení? 🔭
Při menším zvážení se nejedná o „nahrazení vědců“. Jde o „rozšíření vědeckého záběru“. Nature 2023 (přehled objevů ligandů)
Pomáhá týmům:
-
prozkoumávat více hypotéz týdně
-
navrhnout více kandidátských struktur za cyklus
-
inteligentněji upřednostňovat experimenty
-
komprimovat iterační smyčky mezi návrhem a testováním
-
sdílejte znalosti napříč oddělenými platformami Patterns 2025 (LLM v oblasti objevování léčiv)
A možná nejvíce podceňovaná část: pomáhá vám to neplýtvat drahou lidskou kreativitou na opakující se úkoly. Lidé by měli přemýšlet o mechanismu, strategii a interpretaci – ne trávit dny ručním generováním seznamů variant. Nature 2023 (přehled objevů ligandů)
Takže ano, role generativní umělé inteligence v objevování léků je akcelerátor, generátor, filtr a někdy i problémový faktor. Ale cenná.
Závěrečné shrnutí 🧾✅
Generativní umělá inteligence se stává klíčovou schopností v moderním objevování léků, protože dokáže generovat molekuly, hypotézy, sekvence a trasy rychleji než lidé – a může týmům pomoci vybrat lepší experimenty. Přehled Frontiers in Drug Discovery 2024, Nature 2023 (přehled objevování ligandů).
Souhrnné odrážky:
-
Nejlepší je pro včasné objevování a optimalizaci leadů ⚙️ REINVENT 4
-
Podporuje malé molekuly a biologické látky GENTRL (Nature Biotech 2019) ProteinMPNN (Science 2022)
-
Zvyšuje produktivitu rozšířením nápadového trychtýře. Nature 2023 (přehled objevů ligandů).
-
Potřebuje omezení, validaci a lidi, aby se zabránilo sebevědomým nesmyslům. Principy OECD QSAR. Průvodce pro klinické lékaře (halucinace).
-
Největší výhry plynou z integrace pracovních postupů , nikoli z marketingové pěny. Nature 2023 (recenze objevu ligandů)
Pokud s ním budete zacházet jako se spolupracovníkem – ne jako s věštbou – může skutečně posouvat programy vpřed. A pokud s ním budete zacházet jako s věštbou… no, můžete skončit tak, že budete zase sledovat tu GPS do jezera. 🚗🌊
Často kladené otázky
Jaká je role generativní umělé inteligence ve vývoji léků?
Generativní umělá inteligence primárně rozšiřuje cestu k novým nápadům a optimalizaci potenciálních zákazníků tím, že navrhuje kandidátní molekuly, proteinové sekvence, syntetické cesty a biologické hypotézy. Její hodnota spočívá méně v „nahrazování experimentů“ a více ve „výběru lepších experimentů“ generováním mnoha možností a jejich následným důkladným filtrováním. Nejlépe funguje jako akcelerátor v rámci disciplinovaného pracovního postupu, nikoli jako samostatný rozhodovací orgán.
Kde si generativní umělá inteligence vede nejlépe v rámci celého procesu vývoje léků?
Obvykle přináší největší hodnotu tam, kde je prostor pro hypotézy obrovský a iterace je nákladná, jako je identifikace shod, de novo návrh a optimalizace potenciálních zákazníků. Týmy jej také používají pro třídění ADMET, návrhy retrosyntézy a podporu literatury nebo hypotéz. Největší zisky obvykle plynou z integrace generování s filtry, bodováním a lidskou kontrolou, spíše než z očekávání, že jeden model bude „chytrý“
Jak nastavíte omezení, aby generativní modely neprodukovaly zbytečné molekuly?
Praktickým přístupem je definovat omezení před generováním: rozsahy vlastností (jako je rozpustnost nebo cílové hodnoty logP), pravidla pro scaffold nebo substrukturu, vlastnosti vazebných míst a limity novosti. Poté se vynucují filtry medicinální chemie (včetně PAINS/reaktivních skupin) a kontroly syntetizovatelnosti. Generování s omezeními je obzvláště užitečné u molekulárního designu difuzního typu a frameworků, jako je REINVENT 4, kde lze kódovat víceúčelové cíle.
Jak by měly týmy ověřovat výstupy GenAI, aby se vyhnuly halucinacím a přehnané sebedůvěře?
Každý výstup zacházejte s hypotézou, nikoli se závěrem, a ověřujte jej pomocí testů a ortogonálních modelů. Generování párů s agresivním filtrováním, dokováním nebo bodováním, kde je to vhodné, a kontrolami aplikovatelnosti prediktorů ve stylu QSAR. Pokud je to možné, zviditelněte nejistotu, protože modely se mohou s jistotou mýlit v chemii mimo distribuci nebo v nejistých biologických tvrzeních. Kontrola „human-in-the-loop“ zůstává klíčovým bezpečnostním prvkem.
Jak můžete zabránit úniku dat, riziku IP a „uloženým“ výstupům?
Používejte řízení a kontroly přístupu, aby citlivé detaily programu nebyly náhodně vkládány do výzev, a výzvy/výstupy zaznamenávejte pro účely auditu. Vynucujte kontroly novosti a podobnosti, aby generovaní kandidáti nebyli příliš blízko známých sloučenin nebo chráněných oblastí. Dodržujte jasná pravidla o tom, jaká data jsou povolena v externích systémech, a pro práci s vysokou citlivostí upřednostňujte kontrolované prostředí. Lidská kontrola pomáhá včas odhalit „příliš známé“ návrhy.
Jak se generativní umělá inteligence používá pro optimalizaci leadů a ladění více parametrů?
V optimalizaci potenciálních zákazníků je generativní umělá inteligence cenná, protože dokáže navrhnout více kompromisních řešení namísto honění se za jedinou „dokonalou“ sloučeninou. Mezi běžné pracovní postupy patří návrh analogů, řízené skenování substituentů a přeskakování mezi scaffoldy, když omezení účinnosti, toxicity nebo IP blokují pokrok. Prediktory vlastností mohou být křehké, takže týmy obvykle seřazují kandidáty pomocí více modelů a poté experimentálně potvrzují nejlepší možnosti.
Může generativní umělá inteligence pomoci i s biologickými látkami a proteinovým inženýrstvím?
Ano – týmy jej používají pro generování sekvencí protilátek, nápady na afinitní zrání, zlepšení stability a průzkum enzymů nebo peptidů. Generování proteinů/sekvencí může vypadat věrohodně, aniž by bylo vyvinuto, proto je důležité aplikovat filtry vývoje, imunogenicity a vyrobitelnosti. Strukturální nástroje jako AlphaFold mohou podpořit uvažování, ale „věrohodná struktura“ stále není důkazem exprese, funkce nebo bezpečnosti. Smyčky v mokré laboratoři zůstávají nezbytné.
Jak generativní umělá inteligence podporuje plánování syntézy a retrosyntézu?
Plánovači retrosyntézy mohou navrhovat trasy, výchozí materiály a pořadí tras, aby urychlili generování nápadů a rychle vyloučili neproveditelné cesty. Nástroje a přístupy, jako je plánování ve stylu AiZynthFinder, jsou nejúčinnější, když jsou spojeny s kontrolami proveditelnosti v reálném světě od chemiků. Dostupnost, bezpečnost, omezení škálování a „papírové reakce“, které v praxi selhávají, stále vyžadují lidský úsudek. Použití tohoto způsobu šetří čas, aniž by se předstíralo, že chemie je vyřešena.
Reference
-
Nature - Přehled objevů ligandů (2023) - nature.com
-
Přírodní biotechnologie - GENTRL (2019) - nature.com
-
Příroda - AlphaFold (2021) - nature.com
-
Příroda - RFdifúze (2023) - nature.com
-
Přírodní biotechnologie - Generátor proteinů (2024) - nature.com
-
Nature Communications - Dávkové efekty v buněčném zobrazování (2024) - nature.com
-
npj digitální medicína - halucinace + bezpečnostní rámec (2025) - nature.com
-
npj Digitální medicína - Multimodální v biotechnologiích (2025) - nature.com
-
Věda - ProteinMPNN (2022) - science.org
-
Cell Patterns - LLM v oblasti objevování léčiv (2025) - cell.com
-
ScienceDirect (Elsevier) - Generativní modely v de novo návrhu léčiv (2024) - sciencedirect.com
-
ScienceDirect (Elsevier) - Vogt (2023): obavy ohledně novosti/jedinečnosti - sciencedirect.com
-
Analýza lékařských obrazů (ScienceDirect) - Multimodální umělá inteligence v medicíně (2025) - sciencedirect.com
-
PubMed Central - Průvodce pro lékaře (riziko halucinací) - nih.gov
-
Účty chemického výzkumu (publikace ACS) - Chemický prostor (2015) - acs.org
-
PubMed Central - Irwin & Shoichet (2009): chemická prostorová škála - nih.gov
-
Frontiers in Drug Discovery (PubMed Central) - Recenze (2024) - nih.gov
-
Journal of Chemical Information and Modeling (ACS Publications) - Difuzní modely v de novo návrhu léčiv (2024) - acs.org
-
PubMed Central - REINVENT 4 (otevřený rámec) - nih.gov
-
PubMed Central - ADMETlab 2.0 (rané verze ADMET) - nih.gov
-
OECD - Zásady pro validaci modelů (Q)SAR pro regulační účely - oecd.org
-
OECD - Pokyny k validaci modelů (Q)SAR - oecd.org
-
Účty chemického výzkumu (publikace ACS) - Počítačem podporované plánování syntézy / CASP (Coley, 2018) - acs.org
-
ACS Central Science (ACS Publications) - Počítačem asistovaná retrosyntéza (Coley, 2017) - acs.org
-
PubMed Central - AiZynthFinder (2020) - nih.gov
-
PubMed - Lipinski: Pravidlo 5 kontext - nih.gov
-
Journal of Medicinal Chemistry (publikace ACS) - Baell & Holloway (2010): PAINS - acs.org
-
PubMed - Waring (2015): úbytek - nih.gov
-
PubMed - Rives (2021): modely proteinového jazyka - nih.gov
-
PubMed Central - Leek a kol. (2010): účinky dávkového testování - nih.gov
-
PubMed Central - Přehled Diffusion (2025) - nih.gov
-
FDA - E14 a S7B: klinické a neklinické hodnocení prodloužení intervalu QT/QTc a proarytmického potenciálu (Q&A) - fda.gov
-
Evropská agentura pro léčivé přípravky - přehled směrnice ICH E14/S7B - europa.eu
-
USENIX - Carlini a kol. (2021): extrakce trénovacích dat z jazykových modelů - usenix.org
-
Univerzita v Edinburghu – Digitální výzkumné služby – Zdroj elektronických laboratorních sešitů (ELN) – ed.ac.uk
-
ScienceDirect (Elsevier) - Weaver (2008): Oblast použitelnosti QSAR - sciencedirect.com