ブラウザをAIエージェントのサンドボックスに+リーダーシップの透明性が勝利

今日のインサイトは、AIエージェントの封じ込めに関する技術革新から、エンジニアを管理される子供ではなく大人として扱う管理手法まで幅広く及んでいます。

AIエージェント向けブラウザサンドボックス: Paul KinlanのCo-doデモは、File System Access API、CSPヘッダーとiframeサンドボックス、WebAssembly in Web Workersを使用して、数GBのローカルコンテナなしでコーディングエージェントを安全に実行できることを証明。<input type="file" webkitdirectory>タグは主要ブラウザ全てでディレクトリアクセスが可能。

pytestでの統合例外テスト: 成功・失敗ケースを別々のテストメソッドにする代わりに、nullcontext as producespytest.raisesを単一のパラメータ化テストで使用—従来のアプローチより清潔で保守しやすい。

リーダーシップミーティングへのエンジニア参加が意思決定を変革: Will Larsonは、シニアエンジニアを直属部下にしてすべてのリーダーシップ議論に参加させる6年間の成功を報告。主要な利点:マネージャーが「現実そのもの」ではなく「現実の周辺」を管理することを防ぎ、二重の情報伝達経路を作成。

問題解決前の好奇心が間違いのコストを削減: 誰かが期待に応えられない時、説明責任を適用する前に「何が起こったのか?」と尋ねることで、人間関係を損なうことが少なくなり、対応を変える重要な文脈を明かすことが多い。

ライトハウス採用が採用効果を倍増: よくつながりのある人(StripeのJulia Evansなど)を一人採用することで、ネットワーク効果を通じて後続の採用の質と速度の両方が向上するが、権力関係の慎重なナビゲーションが必要。

#browser-sandboxing#ai-agents#pytest-testing#engineering-leadership#hiring-strategy

8 articles published

Articles

Ned Batchelder

Testing: exceptions and caches

Two testing-related things I found recently. Unified exception testing Kacper Borucki blogged about parameterizing exception testing, and linked to pytest docs and a StackOverflow answer with similar

Will Larson

Writing Visualizations with Remotion

Remotion is having a bit of a moment at the moment, and I decided to play around with the Claude Code integration. Here are a couple videos I was able to make in <10 minutes summarizring data on my bl

Will Larson

Stripe's Lighthouse Hiring pattern.

I did a lot of hiring at Uber, some days I would be doing back-to-back 30 minute phone screens for several hours in a row. That said, while Uber taught me how to hire at scale, it was Stripe that taug

Will Larson

Pressure Without a Plan.

When we launched Digg v4, the old site turned off, but the new site didn’t turn on. There was a lot of pressure to get things working, but no one knew what to do about it. It took almost a month to ge