Kaige Zhang

【李宏毅-生成式AI】Spring 2024, HW7:Understanding what AI is thinking

Introduction 本次作业的主题是【理解人工智能在想什么】,这就涉及到人工智能可解释性的问题了。 人工智能模型发展迅速,在短短十多年间,已经从传统的机器学习模型发展到深度学习模型,再到如今的大语言模型。然而,有两个问题始终没有解决:”why does AI do what it does?“和“how does it do it?” 。人们不理解人工智能模型的”why“和”how...

【李宏毅-生成式AI】Spring 2024, HW6:Learning from Human Preference

Task Overview 使用RLHF(Reinforcement Learning from Human Feedback)训练LLM,使它输出符合人类偏好的回答。这个过程也称为‘Alignment’,中文翻译作‘对齐’。具体‘对齐’什么东西呢?‘对齐’人类的喜好和偏向。 本次作业的目标是训练一个”支持漫画真人化“的LLM。如下图所示,在Alignment之前,模型输出”中立“的回答...

【李宏毅-生成式AI】Spring 2024, HW5:LLM Fine-tuning

Task Overview 训练一个会写唐诗的AI模型。给定AI模型诗的前两句,写出诗的后两句。 原本的LLM不具备写诗的能力。我们用ChatGPT和kimi都试一下👇,它们无一例外都输出了对诗的鉴赏。 没有经过Fine-tuning的模型,不具备写唐诗的能力。我们的目的是教AI模型写唐诗。 Model and Dataset Model 实验提供了两个70亿参数的模...

2024年业界都在用生成式AI干什么?

未来几年,终端业务面临的一大挑战是生成式AI带来的不确定性。搞清楚业界都在用大模型干什么,可以为我们提供一些参考。 未来几年,终端业务面临的一大挑战是生成式AI带来的不确定性。虽然现在还不太好确切地回答这个不确定性在哪里,但是搞清楚业界都在用大模型干什么,可以为我们提供一些参考。 首先看创业公司,他们的业务方向都经过了投资者真金白银的筛选,具备极高的参考价值。根据CB Insights发...

SMBO (Sequential Model-Based Optimization)

预备知识 点估计 vs 区域估计 点估计和区域估计都是统计学中常用的估计方法。 点估计:通过样本数据来估计总体参数的值,得到一个具体的数值作为总体参数的估计值。例如,通过样本数据估计总体均值、总体方差等参数。 区域估计:通过样本数据来估计总体参数的值,并给出一个区间作为总体参数的估计值。例如,通过样本数据估计总体均值的置信区间,可以得到一个区间,这个区间内的值有一定的概率包含总体均值。 ...