LLaMA模型微调版本：斯坦福 Alpaca 详解_北冰洋博览网

LLaMA模型微调版本：斯坦福 Alpaca 详解

日期：2023-06-28 13:16:13 来源：博客园

项目代码：https://github.com/tatsu-lab/stanford_alpaca

博客介绍：https://crfm.stanford.edu/2023/03/13/alpaca.html

Alpaca 总览

Alpaca 是 LLaMA-7B 的微调版本，使用Self-instruct[2]方式借用text-davinct-003构建了52K的数据，同时在其构建策略上做了一些修改。

(相关资料图)

性能上作者对Alpaca进行了评估，与openai的text-davinct-003模型在self-instruct[2]场景下的性能表现相似。所以比起成本来看，Alpaca更便宜。

text-davinct-003 与 chatGPT 同为 gpt3.5模型之一，比GPT-3模型 curie、babbage、ada 模型更好的质量、更长的输出和一致的指令遵循来完成任何语言任务

整体思路如下图

基于 Self-instruct 的数据生成Self-instruct

Self-instruct是一个利用LLM来生成指令遵循数据来指令微调模型的框架，核心贡献是生成指令遵循数据。

指令数据由指令、输入、输出组成。作者的数据生成piple包含四个步骤：

1）生成任务指令，

2）确定指令是否代表分类任务，方便3区别

3）正常任务使用输入优先方法，分类任务使用输出优先的prompt指令方法生成实例

4）过滤低质量的数据。

详细的Self-instruct可以看我别的文章。

Alpaca

Alpaca基于self-instruct，

改用GPT-3.5：text-davinci-003来生成指令数据（self-instruct使用的GPT-3：davinci）指令生成时使用新的prompt，直接一次性生成20个任务的指令（self-instruct是迭代生成的，更费钱）指令生成不区分分类/非分类任务，可能是GPT3.5更好，不需要区别了。每个指令只生成1个实例。

最终的结果是以少于$500的便宜价格获得了52K的数据，下图反映了其数据多样性，内圈是词根是动词的指令，外圈是表示目标的指令。

标签：

上一篇：天天速讯：2023年7月天津限号怎么轮换？

下一篇：最后一页

投资促进

今年TikTok美国广告收入有望达59.6亿美元，是去年2.8倍

特斯拉10年交付近300万辆电动汽车有望7月底突破

辽宁新增2例本土新冠肺炎确诊病例、61例本土无症状感染者

黑龙江新增本土确诊病例16例、本土无症状感染者17例

天津市新增1例本土确诊病例、3例本土无症状感染者

北京新增2例境外输入确诊病例和4例无症状感染者

展览展示

精彩推送

20202021西班牙国王杯（202021赛季西班牙国王杯）

中科创达：在自动驾驶领域公司在高通、地平线、英伟达等平台上都有深入的产品和技术布局即时

中考首日！愿考生们以梦为马，不负韶华！

当前热议!2023款红旗E-QM5 560KM PLUS上市，售19.98万元

正式任命，乒协官宣王皓新岗位，提拔赴任，马龙樊振东送祝福

圣光迪莫值得练吗_圣光迪莫怎么配招

【世界新要闻】迁西板栗的营养价值_板栗的营养价值

高汤白斩鸡的家常做法?_今日视点

粤港澳大湾区禁毒教育基地在广东揭牌

环球热议:教育部公布2023高等学历继续教育拟招生专业和校外教学点设置备案结果

每日观点：华嵘控股(600421)龙虎榜数据(06-26)

彩泥做国庆节礼物,怎么用彩泥做礼物？

梁文博发致歉信，却称被人“泼脏水”

环球滚动:平凡榜样道德力量｜半生坚守，肖兴娥用柔肩撑起七口之家

2023年医药行业专题报告我国医疗器械市场体量庞大且持续增长

群友们的表情包《二百三十三期》_天天微头条

最新快讯!上海贵州茅台实业有限公司社会招聘怎么报名

内容什么填空_精彩的什么填空简介介绍

抵抗军天使凯特琳多少钱能出抵抗军天使凯特琳多少钱天天热门

索尼ZV-E10——更适合小白的相机

焦点报道:爱好者用HD-2D技术重制SFC经典《时空之轮》

焦点观察：130款适配产品龙芯3C5000处理器新增130款适配产品

欢喜就好歌词翻译成普通话（欢喜就好歌词）_天天速递

世界新消息丨钢研纳克：鑫元基金、东方证券等多家机构于6月20日调研我司

重庆江津区：“科技副总”赋能企业创新|环球短讯

京津冀本轮高温综合强度为特强，27日将迎新一轮40℃天气

世界信息:76人双喜临门，3人齐齐加盟！哈里斯被交易，哈登续约合同曝光

共享单车车座近80℃！哪种方法降温最快？记者实测

医疗行为损害赔偿的关键元素有哪些

北京今明两天有雷阵雨，高温略降、有闷热感世界讯息

程序化内容生成框架示例公开，虚幻引擎5全新效果展示环球热头条

四川2023高考志愿填报系统操作流程来了-世界聚看点

西乡农商银行开展2023年防范非法集资宣传月活动|每日快报

全球观察：“刘能”儿子大婚，大咖如云豪车多！曝彩礼1000万，体重150斤！

速递！新疆2023年普通高校招生各批次最低投档控制分数线确定

环球最新：水乳霜精华使用的顺序_水乳霜精华液使用顺序

当前焦点!建行支行查询网点_建行支行查询

吃什么淡化脸上的斑?

甘肃省公安厅发布一周典型电诈案件预警全球微资讯

再续前缘电视剧（再续前缘）每日播报

今亮点！北武当马拉松激烈角逐

中国和尼泊尔首都间直飞航班复航_当前关注

橘猫一般多少钱一只幼崽（橘猫一般多少钱一只）_每日热讯

世界要闻：公文类型有17种_公文类型

天天热头条丨怎样隐藏桌面文件夹图标（怎样把桌面上的文件夹图标改成自己想要的图片）

焦点速看：蚁后百度百科（蚁后是怎么产生的）

环球资讯：《Atelier Marie Remake》将于今年夏天在 Switch 上施展魔法

环球微资讯！炒肉拉皮_关于炒肉拉皮介绍

当前焦点!西户入户门玄关图画_西户冲门玄关挂什么好西户冲门玄关挂什么吉利

全球今头条！巴拿马运河区域迎来降雨将暂缓执行对通行船舶吃水深度的进一步限制

品牌展会

全国巡演

1雄安回迁居民：进城上楼变市民

2上海：提出社区疫情防控管理工作指引，针对薄弱环节努力改进

3江西新增本土“1+18” 南昌开启清明网上祭扫

4福建省发布海浪黄色预警

5截至3月31日19时吉林省新增隔离房源7249间

6山东聊城新增1例本土无症状感染者

7吉林省共启用方舱医院22个收治患者24181人

8吉林省本轮疫情累计密切接触者118045人

9上海累计排查在沪密接者37846人均已落实管控

10江苏宿迁中心城区实施静态管理5天停止一切非必要流动和活动

LLaMA模型微调版本：斯坦福 Alpaca 详解

天天速讯：2023年7月天津限号怎么轮换？

午评：沪指跌0.52％创业板指跌0.84％，北向资金净卖出逾70亿元，煤炭、电力板块逆市走高

快来晒晒你家阳台庭院！青岛第二届精彩阳台宜人庭院评选活动启动

世联赛水原站打响今晚对阵塞尔维亚队中国女排力求稳字当头

双牌何家洞镇积极开展生态护林员培训

热推荐：中微公司：6月27日融资买入1.13亿元，融资融券余额18.83亿元

混动车型销量快速攀升车企竞相布局每日热议

北京推出八项举措集中整治欠薪|天天热头条

南开大学举办2023年高招咨询开放日

剪映快闪文字视频制作_文字快闪视频怎么做-全球观速讯

立高食品（300973）：6月27日北向资金减持4300股_焦点热文

小米MIX Fold 3疑似曝光高通骁龙8 Gen 2折叠屏手机环球新消息

怎样在国家药监局的官方网站查询药品的真伪信息（怎样在国家药监局的官方网站查询药品的真伪）-环球新视野

全球观热点：6月27日基金净值：鹏华动力增长混合(LOF)最新净值0.852，涨0.95%

初中毕业学啥技术吃香_初中毕业学啥专业好观天下

简讯：太酷啦！外国青年在香格里拉来了场“变装秀”

全球热消息：有人假冒国家机关名义伪造文件农业农村部郑重声明

超越优价好物，实现体验领先，全球购平台的下一站在哪里？|时快讯

三亚崖州区启动禁毒行动

今日要闻!重庆龙湖以精工尺度刮起交付“龙卷风”

当前简讯:红楼梦秦钟的故事_红楼梦秦钟

全球资讯：老乡鸡为玩梗明星蔡徐坤道歉：已对相关同事做了思想教育

西乡即将上演“狮王争霸”

警方紧急提醒！这些电话、短信，不可信！-当前短讯

华辰装备(300809.SZ)实控人拟减持合计不超6%股份

注意！山河智能将于7月13日召开股东大会

华为很急，等不起赛力斯

泽诺尼亚6月27日上线韩服泽诺尼亚：玩泽诺尼亚用什么加速器不卡顿|最新快讯

正规开发商退款流程有哪些规定（正规开发商退款流程有哪些）

今日热闻!多国“Z世代”青年体验藏族服饰感受民族风情

全球短讯！S基金机遇与挑战——21世纪创投研究院闭门研讨会将于7月举办

新西兰总理在天津逛超市，吃到家乡奇异果

焦点短讯！胡锡进回应网传“胡锡进商业版图”：有人无聊至极、心术不正

【世界新要闻】怎么完成普雷团本前置任务_普雷团本前置任务

奥联电子股东数降至2.55万户，公司此前被交易所处分|焦点短讯

万里石6月27日盘中涨幅达5%

中央气象台：四川盆地至淮河流域等地将有强降雨华北黄淮等地高温持续

为温网热身！波兰球后手感火热，三盘逆转德国老将取得开门红！_世界热闻

除了史莱克七怪之外，有哪些人从斗罗大陆1活到了斗罗大陆2？

名嘴：开拓者明显选了一个年轻版的利拉德是时候换人继续前进了讯息

45家汽车产业公司入选“中国隐形独角兽企业500强”-讯息

世界快看：大众汽车将在未来两周内削减ID.4及ID.7产量

买进口货，“叔叔”“阿姨”们消费潜力大

热文：华康股份06月26日获沪股通增持6.52万股

中国船舶（600150）：6月26日北向资金增持144.55万股

“五年来最火端午”背后：文化游占近九成 “请三休八”催热长线游-全球最资讯

西红柿与番茄的区别是什么

6月26日基金净值：交银稳固收益债券A最新净值1.2014，跌0.83%

培养方式统分报到证上培养方式统分是什么意思