Bowen Baker

OpenAI Researcher Explains How AI Hides Its Thinking (w/ OpenAI’s Bowen Baker)

And

2077.374 View full episode →

OpenAI Researcher Explains How AI Hides Its Thinking (w/ OpenAI’s Bowen Baker)

We hope that if we make a broad enough suite of evaluations that test monitorability in different ways, that when a model does start to become obfuscated or verbalize less for whatever reason, we'll see one of those evals start to go down.

2079.959 View full episode →

The Neuron: AI Explained

OpenAI Researcher Explains How AI Hides Its Thinking (w/ OpenAI’s Bowen Baker)

And we did kind of show a proof of concept of that in the paper where we directly, deliberately trained models to obfuscate by putting some kind of style-like pressures on the COT.

2095.999 View full episode →

The Neuron: AI Explained

OpenAI Researcher Explains How AI Hides Its Thinking (w/ OpenAI’s Bowen Baker)

And we then did see...

2108.095 View full episode →

The Neuron: AI Explained

OpenAI Researcher Explains How AI Hides Its Thinking (w/ OpenAI’s Bowen Baker)

some of our evals decrease as like a proof of concept that, you know, if a model, if this kind of happened in the wild naturally, we'd maybe be able to catch it.

2109.777 View full episode →

The Neuron: AI Explained

OpenAI Researcher Explains How AI Hides Its Thinking (w/ OpenAI’s Bowen Baker)

Totally possible.

2135.478 View full episode →

The Neuron: AI Explained

OpenAI Researcher Explains How AI Hides Its Thinking (w/ OpenAI’s Bowen Baker)

I guess if I knew what the next scaling paradigm was, I'd be a much richer man.

2136.54 View full episode →

The Neuron: AI Explained

OpenAI Researcher Explains How AI Hides Its Thinking (w/ OpenAI’s Bowen Baker)

Yeah, I think that is definitely a worry.

2175.488 View full episode →

The Neuron: AI Explained

OpenAI Researcher Explains How AI Hides Its Thinking (w/ OpenAI’s Bowen Baker)

We've also like, I mean, so generally in our current experiments, we haven't necessarily found that to be true to a significant extent.

2178.231 View full episode →

The Neuron: AI Explained

OpenAI Researcher Explains How AI Hides Its Thinking (w/ OpenAI’s Bowen Baker)

I think that this is likely because, you know, we are always improving our ability to train even, you know, even a small model.

2188.38 View full episode →

The Neuron: AI Explained

OpenAI Researcher Explains How AI Hides Its Thinking (w/ OpenAI’s Bowen Baker)

It's not like we have our GPT-4 size model and that's the best GPT-4 size model anyone could ever train.

2196.207 View full episode →

The Neuron: AI Explained

OpenAI Researcher Explains How AI Hides Its Thinking (w/ OpenAI’s Bowen Baker)

We're like improving our algorithms, our data.

2202.073 View full episode →

The Neuron: AI Explained

OpenAI Researcher Explains How AI Hides Its Thinking (w/ OpenAI’s Bowen Baker)

you know, no one's sleeping.

2204.615 View full episode →

The Neuron: AI Explained

OpenAI Researcher Explains How AI Hides Its Thinking (w/ OpenAI’s Bowen Baker)

And so I think that, you know, a better model also kind of like has more clear thoughts sometimes, if that makes sense.

2207.579 View full episode →

The Neuron: AI Explained

OpenAI Researcher Explains How AI Hides Its Thinking (w/ OpenAI’s Bowen Baker)

Like a small model, if you look at its thoughts, it sometimes feels a lot more gibberish-y than a bigger model.

2218.074 View full episode →

The Neuron: AI Explained

OpenAI Researcher Explains How AI Hides Its Thinking (w/ OpenAI’s Bowen Baker)

And so, you know, that is maybe the reason why we could expect this to, you know, at least

2225.544 View full episode →

The Neuron: AI Explained

OpenAI Researcher Explains How AI Hides Its Thinking (w/ OpenAI’s Bowen Baker)

not fully, this trend to not fully happen.

2233.015 View full episode →

The Neuron: AI Explained

OpenAI Researcher Explains How AI Hides Its Thinking (w/ OpenAI’s Bowen Baker)

But I think at the limit, it probably should happen.

2236.399 View full episode →

The Neuron: AI Explained

OpenAI Researcher Explains How AI Hides Its Thinking (w/ OpenAI’s Bowen Baker)

Like bigger models will just verbalize less for the most part.

2239.182 View full episode →

The Neuron: AI Explained

OpenAI Researcher Explains How AI Hides Its Thinking (w/ OpenAI’s Bowen Baker)

Yeah.

2243.927 View full episode →

Appearances Over Time

Podcast Appearances

Sign in to Audioscrape

Share this moment