#15: AIとの音声対話を作る時の技術選定と工夫ポイント
03 Mar 2025
Contributed by Lukas
AIとの音声対話を開発するにあたってどんな技術を選ぶかや、体験面で工夫...
#14: 評価駆動開発(Evaluation Driven Development)なアプローチで行うLLMエージェントの設計
16 Jan 2025
Contributed by Lukas
Evalを主軸にLLMエージェントの設計について述べたAn Evaluation-Driven Approach to ...
#13: 最近のTTSについて語る 〜APIサービスから音声モデル作成まで〜
25 Dec 2024
Contributed by Lukas
seyaとkagayaの二人ともハマっていて、最近ホットなTTSサービスについて雑談...
#12: 生成AIでユーザビリティ課題を見つけることができるか? - UX-LLM
04 Dec 2024
Contributed by Lukas
生成AIでユーザビリティ課題を発見することができるかを検証したUX-LLMにつ...
#11: API for AIの時代、Stripe Agent Toolkitについてのよもやま話
27 Nov 2024
Contributed by Lukas
Stripe Agent Toolkitを肴にAgent向けのAPIの時代について想いを馳せました。 ポ...
#10: Agent-as-a-judge 〜エージェントの評価を行うエージェント 〜
18 Nov 2024
Contributed by Lukas
LLM-as-a-Judgeに着想を得て、エージェンティックシステムを評価するためにエ...
#9: 今流行り!?の社内v0開発に取り組んでみてる感想
14 Nov 2024
Contributed by Lukas
Ubie社の事例に触発されて社内v0開発を始めた2人で、開発の知見や悩み、Fig...
#8: Who Validate the Validator? - 継続的な評価をアップデートする仕組み -
04 Nov 2024
Contributed by Lukas
継続的にLLMアプリケーションの評価基準や自動評価をアップデートする仕組...
#7: AIによるプロンプト最適化:Automated Prompting 〜そして評価へ〜
28 Oct 2024
Contributed by Lukas
自動で行うプロンプトチューニング、Auto Prompting、そしてそれを支える評価...
#6: RAG and Beyond 〜4つのレベルで理解するRAGとその先〜
23 Oct 2024
Contributed by Lukas
今回はMicrosoftが公開したRAGタスクを4つのレベルに分類したリサーチである...
#5: OpenAI DevDay 2024の感想 ~Prompt Caching編~
15 Oct 2024
Contributed by Lukas
今回はOpenAI DevDay 2024で発表されたPrompt Cachingがテーマです ポッドキャスト...
#4: ~Embedding first, Chunking Later~ Jina AIが提唱したLate Chunkingについて学ぶ
07 Oct 2024
Contributed by Lukas
今回はJina AIが提唱したLate Chunkingがテーマです。 Jina AIはEmbedding model、Rerank...
#3: 音声AI使ってる?最近の音声AIサービスについて雑談 〜GoogleのNotebookLMとRetell AI、個人開発〜
30 Sep 2024
Contributed by Lukas
音声AIサービスの雑談会です。特にGoogleのNotebookLMのAudio Overview、Illuminate、R...
#2: LLMエージェント for ソフトウェアエンジニアリングの世界
16 Sep 2024
Contributed by Lukas
ソフトウェアエンジニアリング領域のLLMエージェント研究のサーベイ論文で...
#1: Chatbot Arenaのデータを使ってドメイン独自の評価データセットを作る
08 Sep 2024
Contributed by Lukas
Chatbot Arenaのデータを使ってドメイン独自の評価データセットを作るという...