Scott Wu z Cognition říká, že kódovací agenti s umělou inteligencí by neměli nahrazovat lidi ↗
Scott Wu ze společnosti Cognition odmítl myšlenku, že Devin je navržen tak, aby zcela nahradil programátory. Poněkud nepříjemný postoj, vzhledem k tomu, že společnost také tvrdí, že Devin vytváří velkou část vlastního kódu.
Jeho formulace je spíše „kámoši s programováním umělé inteligence“ než „tvou práci sežral notebookový skřet“. Přesto je napětí těžké přehlédnout – lepší agenti, méně výmluv pro nafouklé inženýrské týmy… nebo to tak alespoň zní.
Tento startup s umělou inteligencí vám zdarma uklidí domov a vycvičí budoucí roboty ↗
Společnost Shift nabízí bezplatný úklid domácností s jedním háčkem, který je zároveň praktický i trochu znepokojivý: uklízeči nosí „magický klobouk“ vybavený kamerou, aby společnost mohla shromažďovat data o tréninku robotů.
Návrh je jednoduchý – vy dostanete čistý byt, oni dostanou videozáznam domácích prací. Možná pěkná koupě.
Shift tvrdí, že rozmazává citlivé detaily a anonymizuje záběry, ale širší otázka stále leží jako ponožka pod pohovkou: kolik soukromí jsou lidé ochotni vyměnit za pohodlí?
Anthropic vydává Claude Opus 4.8 ↗
Společnost Anthropic vydala Claude Opus 4.8 s vylepšeními v oblasti kódování, agentních pracovních postupů, uvažování a profesionální práce. Hlavní výhodou je spolehlivost – méně nepodložených tvrzení, lepší využití nástrojů a více samokontrol.
Claude Code také nabízí dynamické pracovní postupy, které umožňují modelu plánovat, spouštět paralelní subagenty, ověřovat výstupy a reportovat. To zní frivolně, dokud si neuvědomíte, že se v podstatě jedná o projektový management v trenčkotu.
Ceny zůstávají rozděleny mezi standardní a rychlý režim, přičemž Anthropic se více zaměřuje na kontrolu úsilí, aby uživatelé mohli slevit z rychlosti, kvality a spalování tokenů.
Foxconn má obrovskou důvěru v růstovou dynamiku díky umělé inteligenci, říká předseda ↗
Předseda představenstva společnosti Foxconn uvedl, že poptávka po umělé inteligenci mění obvyklý sezónní rytmus společnosti. Starý pololetní propad dodavatelů? Zřejmě se už nechová normálně.
Důvodem jsou obrovské výdaje cloudových gigantů na umělou inteligenci, které Foxconn vnímá jako svou vlastní tržní příležitost. To je hardwarová stránka boomu umělé inteligence, méně lesklá než chatboti, ale právě tam, kde se peníze točí.
Foxconn je již významným výrobcem serverů Nvidia, takže jeho optimismus je v podstatě teplotní kontrolou v závodě o infrastrukturu umělé inteligence.
Sdílený návod pro důvěryhodné hodnocení třetích stran ↗
OpenAI zveřejnila pokyny k hodnocení umělé inteligence třetími stranami s argumentem, že testy potřebují jasnější podrobnosti o tom, co bylo hodnoceno, jak to bylo testováno a co mohou výsledky dokázat.
Hlavní bod je překvapivě praktický: hodnocení hraniční umělé inteligence nemůže být jen dohady ve tvaru žebříčku. Hodnotitelé musí vysvětlit testovaný systém, pokyny, ochranná opatření, kontroly platnosti a kde končí tvrzení.
To je důležité, protože jak se modely stávají více agentními, povrchní testy mohou systémy zdánlivě vypadat bezpečněji nebo silněji, než ve skutečnosti jsou. Malá administrativní spotřeba, velké důsledky.
Často kladené otázky
Mají programátoři s umělou inteligencí, jako je Devin, nahradit programátory?
Scott Wu definuje programátory umělé inteligence jako programátorské partnery, nikoli jako plnohodnotnou náhradu za lidské programátory. Článek však poukazuje na určité rozpory: Devin je také popisován jako člověk, který se velkou měrou podílí na tvorbě vlastního kódu Cognition. V praxi z toho vyplývá, že tyto nástroje mohou omezit rutinní inženýrskou práci, a přitom stále záviset na lidech, pokud jde o jejich úsudek, směr a odpovědnost.
Proč Shift nabízí bezplatný úklid domácnosti pro data pro trénink umělé inteligence?
Společnost Shift nabízí bezplatný úklid domácností, protože chce fyzická videozáznamy domácích prací pro výcvik budoucích robotů. Uklízeči nosí při práci „magický klobouk“ vybavený kamerou, který vytváří záběry, jež mohou systémům umělé inteligence pomoci porozumět domácím úkolům. Výměna je jasná: zákazníci získají čistý domov, zatímco společnost získává data ze soukromých obytných prostor.
Jak Shift nakládá s ochranou soukromí při shromažďování záběrů z úklidu domácnosti?
Článek uvádí, že Shift tvrdí, že rozmazává citlivé detaily a anonymizuje záběry. To může snížit některá rizika pro soukromí, ale neodstraňuje to širší obavy z nahrávání uvnitř domovů lidí. Pro uživatele je ústřední otázkou, zda pohodlí bezplatného úklidu stojí za takovou úroveň sběru dat.
Co je nového v Claude Opus 4.8?
Claude Opus 4.8 je popisován jako vylepšení kódování, agentních pracovních postupů, uvažování a profesionální práce. Aktualizace se zaměřuje na spolehlivost, včetně menšího počtu nepodložených tvrzení, silnějšího využití nástrojů a větší samokontroly. Claude Code také získává dynamické pracovní postupy, kde model může plánovat, spouštět paralelní subagenty, ověřovat výstupy a reportovat výsledky.
Proč je optimismus Foxconnu ohledně boomu umělé inteligence důležitý?
Sebedůvěra společnosti Foxconn je důležitá, protože odráží hardwarovou stránku boomu umělé inteligence. Předseda společnosti uvedl, že poptávka po umělé inteligenci mění svůj obvyklý sezónní vzorec a výdaje cloudových gigantů na infrastrukturu vytvářejí velkou tržní příležitost. Vzhledem k tomu, že Foxconn je již významným výrobcem serverů Nvidia, slouží jeho komentáře jako silný signál pro poptávku po infrastruktuře umělé inteligence.
Co říká OpenAI o tom, proč jsou hodnocení umělé inteligence třetích stran důvěryhodná?
OpenAI tvrdí, že hodnocení umělé inteligence potřebuje jasnější vysvětlení toho, jaký systém byl testován, jak byl testován a co výsledky skutečně ukazují. To zahrnuje podrobnosti o pokynech, ochranných opatřeních, kontrolách platnosti a limitech jakýchkoli tvrzení. Tento bod je obzvláště důležitý pro agentovější modely, kde povrchní testy mohou systémy zdánlivě vykreslit jako bezpečnější nebo schopnější, než ve skutečnosti jsou.