Daryl Morey
👤 PersonAppearances Over Time
Podcast Appearances
Es kann, und er hat mir das, was ich als ein mittelhafter Problem fand, gegeben. Und es hat es schlagartig beantwortet. Das ist auf 4.5, das Neueste von OpenAI. Dann gab es ein mittelhafter Problem, das auch schlagartig beantwortet wurde. Und dann war ich mit Monty McNair von The Kings. He formulated one that he thought was hard and it did fail, the hard one.
Es kann, und er hat mir das, was ich als ein mittelhafter Problem fand, gegeben. Und es hat es schlagartig beantwortet. Das ist auf 4.5, das Neueste von OpenAI. Dann gab es ein mittelhafter Problem, das auch schlagartig beantwortet wurde. Und dann war ich mit Monty McNair von The Kings. He formulated one that he thought was hard and it did fail, the hard one.
So I think we, yes, we have the same problem that law firms have, which is even though it gets the answer 98.9% right, you can't hand it to a client who's paying you that much money unless it's, well, nothing's 100, but you probably need a higher sigma on your, or at least to say there was a human who looked at it, right? Because you're like, oh, you just took the algorithm. You're like...
So I think we, yes, we have the same problem that law firms have, which is even though it gets the answer 98.9% right, you can't hand it to a client who's paying you that much money unless it's, well, nothing's 100, but you probably need a higher sigma on your, or at least to say there was a human who looked at it, right? Because you're like, oh, you just took the algorithm. You're like...
So I think we, yes, we have the same problem that law firms have, which is even though it gets the answer 98.9% right, you can't hand it to a client who's paying you that much money unless it's, well, nothing's 100, but you probably need a higher sigma on your, or at least to say there was a human who looked at it, right? Because you're like, oh, you just took the algorithm. You're like...
Ja, das funktioniert nicht. Das wird eventuell funktionieren. Oder wenn Leute sagen, das ist eine hohe Sigma, dann nehme ich die Antwort vom Algorithmus.
Ja, das funktioniert nicht. Das wird eventuell funktionieren. Oder wenn Leute sagen, das ist eine hohe Sigma, dann nehme ich die Antwort vom Algorithmus.
Ja, das funktioniert nicht. Das wird eventuell funktionieren. Oder wenn Leute sagen, das ist eine hohe Sigma, dann nehme ich die Antwort vom Algorithmus.
Also, das ist mein Test, seit die LLMs rausgekommen sind. Und nur 4 oder 5 sind die ersten, die das lösen. Ich würde es geben, seit dem ersten Open-Eye-Problem, habe ich einem Artifizierten Monty-Hall-Problem gegeben, zu den LLMs. Und es ist perfekt, weil sie trainiert sind. Es gibt so viele Artikel darüber,
Also, das ist mein Test, seit die LLMs rausgekommen sind. Und nur 4 oder 5 sind die ersten, die das lösen. Ich würde es geben, seit dem ersten Open-Eye-Problem, habe ich einem Artifizierten Monty-Hall-Problem gegeben, zu den LLMs. Und es ist perfekt, weil sie trainiert sind. Es gibt so viele Artikel darüber,
Also, das ist mein Test, seit die LLMs rausgekommen sind. Und nur 4 oder 5 sind die ersten, die das lösen. Ich würde es geben, seit dem ersten Open-Eye-Problem, habe ich einem Artifizierten Monty-Hall-Problem gegeben, zu den LLMs. Und es ist perfekt, weil sie trainiert sind. Es gibt so viele Artikel darüber,
Es wird trainiert auf 1 Billion Artikeln und die Antwort ist immer, in diesen Artikeln zu wechseln. Das ist fantastisch. Mit einigen kleinen Ergänzungen. Ich habe also ein Money Help Problem gegeben, damit die Leute das wissen. Drei Türen. Du wählst eine Tür, ich wähle Tür 1. Der Host öffnet dann eine andere Tür und sagt, okay, du kannst entweder die Tür halten oder du willst wechseln.
Es wird trainiert auf 1 Billion Artikeln und die Antwort ist immer, in diesen Artikeln zu wechseln. Das ist fantastisch. Mit einigen kleinen Ergänzungen. Ich habe also ein Money Help Problem gegeben, damit die Leute das wissen. Drei Türen. Du wählst eine Tür, ich wähle Tür 1. Der Host öffnet dann eine andere Tür und sagt, okay, du kannst entweder die Tür halten oder du willst wechseln.
Es wird trainiert auf 1 Billion Artikeln und die Antwort ist immer, in diesen Artikeln zu wechseln. Das ist fantastisch. Mit einigen kleinen Ergänzungen. Ich habe also ein Money Help Problem gegeben, damit die Leute das wissen. Drei Türen. Du wählst eine Tür, ich wähle Tür 1. Der Host öffnet dann eine andere Tür und sagt, okay, du kannst entweder die Tür halten oder du willst wechseln.
Und es scheint, wenn du wechselst, kriegst du 2 aus 3 Wahrscheinlichkeiten, wenn nicht... Die meisten von uns wissen das wahrscheinlich. Aber das Wichtigste an dem Monty Hall Problem ist, dass Monty Hall weiß, welche Tür zu öffnen. Also habe ich formuliert, dass ich es wechseln muss. Ich stelle es in Säcke.
Und es scheint, wenn du wechselst, kriegst du 2 aus 3 Wahrscheinlichkeiten, wenn nicht... Die meisten von uns wissen das wahrscheinlich. Aber das Wichtigste an dem Monty Hall Problem ist, dass Monty Hall weiß, welche Tür zu öffnen. Also habe ich formuliert, dass ich es wechseln muss. Ich stelle es in Säcke.
Und es scheint, wenn du wechselst, kriegst du 2 aus 3 Wahrscheinlichkeiten, wenn nicht... Die meisten von uns wissen das wahrscheinlich. Aber das Wichtigste an dem Monty Hall Problem ist, dass Monty Hall weiß, welche Tür zu öffnen. Also habe ich formuliert, dass ich es wechseln muss. Ich stelle es in Säcke.
Und dann habe ich eine Person, die einfach vorbeikommt und sagt, dass es nichts in einer Säcke gibt, aber ohne irgendwelche Wissen der anderen. Und sagt, willst du wechseln? In dieser Formulierung ist es kein Vorteil, zu wechseln. Und 4.5 war der erste, der es richtig gemacht hat. Alle anderen waren wie Switch. Ja, fantastisch. Und das war mein kleiner Test, wie weit sie sich verbessern.
Und dann habe ich eine Person, die einfach vorbeikommt und sagt, dass es nichts in einer Säcke gibt, aber ohne irgendwelche Wissen der anderen. Und sagt, willst du wechseln? In dieser Formulierung ist es kein Vorteil, zu wechseln. Und 4.5 war der erste, der es richtig gemacht hat. Alle anderen waren wie Switch. Ja, fantastisch. Und das war mein kleiner Test, wie weit sie sich verbessern.
Und dann habe ich eine Person, die einfach vorbeikommt und sagt, dass es nichts in einer Säcke gibt, aber ohne irgendwelche Wissen der anderen. Und sagt, willst du wechseln? In dieser Formulierung ist es kein Vorteil, zu wechseln. Und 4.5 war der erste, der es richtig gemacht hat. Alle anderen waren wie Switch. Ja, fantastisch. Und das war mein kleiner Test, wie weit sie sich verbessern.