Research

1st Place in the ARC-AGI-3 Preview Competition

August 21, 2025

We present our winning solution for the ARC-AGI-3 Agent Preview Competition.

AlphaWrite: Inference-Time Compute Scaling for Writing

June 6, 2025

We introduce AlphaWrite, an inference-time scaling method for creative writing that uses evolutionary generation and ELO-based ranking to improve story quality.

Self-Rewarding, Self-Improving

May 12, 2025

We demonstrate that large language models can autonomously improve by judging their own solutions without reference answers, creating a complete self-learning loop that enhances performance beyond existing benchmarks.

LLMs for Engineering: Teaching Models to Design High-Powered Rockets

April 24, 2025

We demonstrate that while current SOTA language models struggle with iterative self-improvement in rocket engineering challenges, augmenting them with reinforcement learning unlocks superhuman design capabilities that could revolutionize physical engineering domains.

Latest Posts

1st Place in the ARC-AGI-3 Preview Competition

AlphaWrite: Inference-Time Compute Scaling for Writing

Self-Rewarding, Self-Improving

LLMs for Engineering: Teaching Models to Design High-Powered Rockets

Text to RL: Extracting High-Quality RL Questions from Text