ARC-AGI-3 soll agentische KI unter offenen Mehrschritt-Aufgaben prüfen

Ein am 24. März veröffentlichter Benchmark testet agentische KI in turn-basierten Umgebungen statt mit kurzen Einzelantworten. Laut der Arbeit lösen Menschen alle Aufgaben, während Frontier-Modelle unter 1 Prozent bleiben.

30. März 2026 · 07:03Quelle: arXiv / ARC Prize Foundation

Zurück zur Übersicht

ARC-AGI-3 testet agentische KI: Menschen bei 100 Prozent, Modelle unter 1 Prozent | KI Weekly

ARC-AGI-3 soll agentische KI unter offenen Mehrschritt-Aufgaben prüfen

ARC-AGI-3 soll agentische KI unter offenen Mehrschritt-Aufgaben prüfen

Erwähnt

WEKA und Oracle bestätigen 10× Durchsatzsteigerung für Langkontext-KI auf OCI H100-Cluster

SpaceX setzt IPO-Preis auf 135 US-Dollar und plant rund 75 Milliarden Dollar Emission

Google bringt Gemini Go auf Android Go Smartphones mit 2 GB RAM

RBI verlangt von Banken KI-Risiko-Assessment und Maßnahmenplan bis Ende Juni

OneAdvanced stellt NHS-trainiertes „Care Navigator“ LLM vor

WEKA und Oracle bestätigen 10× Durchsatzsteigerung für Langkontext-KI auf OCI H100-Cluster

SpaceX setzt IPO-Preis auf 135 US-Dollar und plant rund 75 Milliarden Dollar Emission

Google bringt Gemini Go auf Android Go Smartphones mit 2 GB RAM

RBI verlangt von Banken KI-Risiko-Assessment und Maßnahmenplan bis Ende Juni

OneAdvanced stellt NHS-trainiertes „Care Navigator“ LLM vor

Anthropic stellt Claude Fable 5 vor, Mythos 5 bleibt eingeschränkt

Broadcom, Apollo und Blackstone starten Plattform für KI Rechenkapazität

OpenAI reicht vertraulichen Entwurf einer S-1 bei der US-SEC ein

EU-Kommission schlägt Cloud and AI Development Act

Volante bringt 'Vol360i': agentische KI in die Zahlungsabwicklung von Banken

ARC-AGI-3 soll agentische KI unter offenen Mehrschritt-Aufgaben prüfen

ARC-AGI-3 soll agentische KI unter offenen Mehrschritt-Aufgaben prüfen

Erwähnt

Das könnte dich auch interessieren

WEKA und Oracle bestätigen 10× Durchsatzsteigerung für Langkontext-KI auf OCI H100-Cluster

SpaceX setzt IPO-Preis auf 135 US-Dollar und plant rund 75 Milliarden Dollar Emission

Google bringt Gemini Go auf Android Go Smartphones mit 2 GB RAM

RBI verlangt von Banken KI-Risiko-Assessment und Maßnahmenplan bis Ende Juni

OneAdvanced stellt NHS-trainiertes „Care Navigator“ LLM vor

Das könnte dich auch interessieren

WEKA und Oracle bestätigen 10× Durchsatzsteigerung für Langkontext-KI auf OCI H100-Cluster

SpaceX setzt IPO-Preis auf 135 US-Dollar und plant rund 75 Milliarden Dollar Emission

Google bringt Gemini Go auf Android Go Smartphones mit 2 GB RAM

RBI verlangt von Banken KI-Risiko-Assessment und Maßnahmenplan bis Ende Juni

OneAdvanced stellt NHS-trainiertes „Care Navigator“ LLM vor

Anthropic stellt Claude Fable 5 vor, Mythos 5 bleibt eingeschränkt

Broadcom, Apollo und Blackstone starten Plattform für KI Rechenkapazität

OpenAI reicht vertraulichen Entwurf einer S-1 bei der US-SEC ein

EU-Kommission schlägt Cloud and AI Development Act

Volante bringt 'Vol360i': agentische KI in die Zahlungsabwicklung von Banken