Dr. Jeff Beck

Machine Learning Street Talk (MLST)

VAEs Are Energy-Based Models? [Dr. Jeff Beck]

Yes, there is more computation involved, but we've got a lot of great tricks for making that totally tractable.

1147.141 View full episode →

Machine Learning Street Talk (MLST)

VAEs Are Energy-Based Models? [Dr. Jeff Beck]

Regularization term, I think, is the short answer, right?

1158.775 View full episode →

Machine Learning Street Talk (MLST)

VAEs Are Energy-Based Models? [Dr. Jeff Beck]

No, so the difference between, and if you're being very, very, very pedantic

1162.961 View full episode →

Machine Learning Street Talk (MLST)

VAEs Are Energy-Based Models? [Dr. Jeff Beck]

The difference between minimizing energy and minimizing free energy is that free energy has this additional entropy penalty term.

1169.452 View full episode →

Machine Learning Street Talk (MLST)

VAEs Are Energy-Based Models? [Dr. Jeff Beck]

Now, if you're just doing maximum likelihood estimation, if you're minimizing your energy function with respect to some particular, well, let's pretend we're only worried about one variable.

1177.042 View full episode →

Machine Learning Street Talk (MLST)

VAEs Are Energy-Based Models? [Dr. Jeff Beck]

And I'm just going to get a point estimate and call it a day, do some kind of map estimation to get that one thing.

1185.372 View full episode →

Machine Learning Street Talk (MLST)

VAEs Are Energy-Based Models? [Dr. Jeff Beck]

There's not that big of a difference, right?

1192.081 View full episode →

Machine Learning Street Talk (MLST)

VAEs Are Energy-Based Models? [Dr. Jeff Beck]

Because there is no probability distribution over the latent that allows you to compute that regularization term.

1193.926 View full episode →

Machine Learning Street Talk (MLST)

VAEs Are Energy-Based Models? [Dr. Jeff Beck]

But that's the only difference.

1200.825 View full episode →

Machine Learning Street Talk (MLST)

VAEs Are Energy-Based Models? [Dr. Jeff Beck]

It's are you regularizing or not is, I think, the easiest way to think about it.

1202.169 View full episode →

Machine Learning Street Talk (MLST)

VAEs Are Energy-Based Models? [Dr. Jeff Beck]

It's joint embedding prediction architecture.

1225.592 View full episode →

Machine Learning Street Talk (MLST)

VAEs Are Energy-Based Models? [Dr. Jeff Beck]

There we go.

1230.14 View full episode →

Machine Learning Street Talk (MLST)

VAEs Are Energy-Based Models? [Dr. Jeff Beck]

So what's the joint embedding bit about?

1230.961 View full episode →

Machine Learning Street Talk (MLST)

VAEs Are Energy-Based Models? [Dr. Jeff Beck]

Well, the joint embedding bit about is, well, I'm going to take my inputs, I'm going to take my outputs, and I'm going to embed them in some space.

1233.445 View full episode →

Machine Learning Street Talk (MLST)

VAEs Are Energy-Based Models? [Dr. Jeff Beck]

And then I'm going to learn a prediction between the two embeddings.

1240.935 View full episode →

Machine Learning Street Talk (MLST)

VAEs Are Energy-Based Models? [Dr. Jeff Beck]

And that's a great idea.

1244.24 View full episode →

Machine Learning Street Talk (MLST)

VAEs Are Energy-Based Models? [Dr. Jeff Beck]

It's a great idea because it has some of the flavor of what we would like to get out of our models.

1245.122 View full episode →

Machine Learning Street Talk (MLST)

VAEs Are Energy-Based Models? [Dr. Jeff Beck]

We're not interested in predicting, in many situations, I should be very particular about this, in many situations, we're not interested in predicting every single pixel on the image.

1249.788 View full episode →

Machine Learning Street Talk (MLST)

VAEs Are Energy-Based Models? [Dr. Jeff Beck]

We want to get, you know, maybe something that's a little more gestalt, a little more high level, a little more conceptual understanding of what's going on.

1257.86 View full episode →

Machine Learning Street Talk (MLST)

VAEs Are Energy-Based Models? [Dr. Jeff Beck]

And so emphasizing the goal of predicting every single pixel, which is what's typically done in generative modeling right now, you know, might lose some of the power, the abstractive power of some of the networks.

1264.271 View full episode →

Appearances Over Time

Podcast Appearances

Sign in to Audioscrape

Share this moment