Menu
Sign In Search Podcasts Charts People & Topics Add Podcast API Pricing
Podcast Image

エンジニアがもがくラジオ

オンラインゲームと多腕バンディット問題

21 Sep 2025

Description

オンラインサッカーゲーム「Rematch」を実況プレイ中の話題からスタートオフサイドもファールも何でもありの自由すぎるルールと、ランクシステムの面白さネイティブ世代とのジェネレーションギャップ──小学生がタブレットでマイクラをやっていた10年前、30代の自分には想像できなかった世界当初は恐怖さえあったオンラインゲームと、そのマッチングシステムに夢を描いていた頃の話そこから「多腕バンディット問題」へ:探索と活用のバランスをどう取るかという、報酬最適化の有名な課題ε-Greedy法、UCB法、Thompson Samplingなどの代表的アルゴリズムベータ分布を使った成功確率の表現とランダムサンプリングの仕組みpCVR(コンバージョン率の高さ)とのつながりや、強化学習の一種としての位置付け倒立振り子問題の例で考える強化学習の難しさLLMは教師あり学習?教師なし学習?──自己教師あり学習の位置づけ知らない分野を深く学ぶなら、まずDeepResearchで調べてから音声モードで聞き込み学習するのがおすすめ----少し出遅れてエンジニアとしてのキャリアをスタートさせた、わたくし「とっく」が技術に必死にしがみついたり、キャリアについて迷ったり、色々と試行錯誤して成長しようともがく様子をお届けする番組です。ご意見・ご感想は、Xのハッシュタグ #エンジニアがもがくラジオ にお寄せください。【とっく】𝕏: https://x.com/tokkuu・Profile: https://www.tokku-tech.dev/【イルカ】Twitch: https://www.twitch.tv/irukamindYouTube: https://www.youtube.com/@irukamindTikTok: https://www.tiktok.com/@irukamind88𝕏: https://x.com/irukamindInstagram: https://www.instagram.com/irukamind88

Audio
Featured in this Episode

No persons identified in this episode.

Transcription

This episode hasn't been transcribed yet

Help us prioritize this episode for transcription by upvoting it.

0 upvotes
🗳️ Sign in to Upvote

Popular episodes get transcribed faster

Comments

There are no comments yet.

Please log in to write the first comment.