京东当前网站做的营销活动wordpress调用子目录名称-万宁市网站建设公司-Seo优化

京东当前网站做的营销活动,wordpress调用子目录名称,山东鸿泰建设集团有限公司网站,郑州seo顾问热狗作为一名对 AI 和机器学习充满热情的人#xff0c;我花了不少时间研究怎么让强大的语言模型更好地完成特定任务。今天#xff0c;我想分享一份详细的指南#xff0c;教你如何用 Python 微调 LLM#xff08;大型语言模型#xff09;#xff0c;然后用 Ollama 这个工具在本…作为一名对 AI 和机器学习充满热情的人我花了不少时间研究怎么让强大的语言模型更好地完成特定任务。今天我想分享一份详细的指南教你如何用 Python 微调 LLM大型语言模型然后用 Ollama 这个工具在本地运行微调后的模型。这份指南基于我看到的一个实际操作教程但我会加上详细的解释和例子让它更全面、更适合新手什么是 LLM 微调想象一下你请了个世界级大厨他啥菜都会做但还得学会你家的独门菜谱。你不用从头教他做饭只需要给他看几道你的菜就行。这就是微调微调是拿一个已经预训练好的 LLM比如 GPT 或 Llama它已经很懂得通用语言了然后针对你的特定任务“调校”一下。你给它喂一些你领域的例子它就会调整自己的知识专门为这个领域发光发热。它咋工作的从一个懂得英语或其他语言的 base model 开始给它一堆“输入”比如一个问题和“输出”比如完美答案的配对。模型会调整内部 weights 来匹配这些例子。跟 prompting 的区别Prompting 就像临时给指令比如“写得像莎士比亚”而微调是永久改变模型让它表现更稳定。跟 parameter tuning 的区别Parameter tuning 是调整像“temperature”输出多有创意这样的设置就像调车上的收音机。微调则是给引擎升级让它能跑越野。举个例子假设你想让 LLM 从乱糟糟的邮件里提取信息。没微调前Prompt: “从‘嗨我是 John。订个披萨。’中提取名字和订单。”输出可能很随机比如“Name: John, Food: Pizza”或者只是个总结。微调后用 100 封邮件例子训练。现在它总会输出 JSON 格式{name: John, order: pizza}。什么时候需要微调 LLM别啥都微调这就像买跑车去买菜得看情况用•需要一致的格式/风格Prompting 搞不定严格的输出比如 JSON 或法律文档。•领域专属数据模型没见过你的小众领域比如医学术语或公司日志。•省钱用一个小的、微调过的模型替代像 GPT-4 这样的大模型。优点和缺点微调的替代方案•Prompt Engineering快又免费但不稳定。•Retrieval-Augmented Generation (RAG)实时加外部数据比如先搜文档再回答。•从头训练只有像 OpenAI 这样的大公司才玩得起需要海量数据和算力。微调 LLM 的完整步骤下面是全流程。我们会用 Unsloth一个免费、开源、快速微调工具和 Google Colab免费的云端 GPU不用高端硬件。Base model 用 Phi-3 Mini又小又快。流程图步骤 1收集数据这步很关键垃圾数据垃圾模型。需要 JSON 格式的输入-输出配对。示例数据集用于 HTML 提取比如从网页代码里提取产品信息文件extraction_dataset.json内容简化版500 个例子中的 2 个[ { input:divh2Product: Laptop/h2pPrice: $999/pspanCategory: Electronics/spanspanManufacturer: Dell/span/div, output:{name:Laptop,price:$999,category:Electronics,manufacturer:Dell} }, { input:divh2Product: Book/h2pPrice: $20/pspanCategory: Literature/spanspanManufacturer: Penguin/span/div, output:{name:Book,price:$20,category:Literature,manufacturer:Penguin} } ]小贴士如果需要可以用 AI 生成数据但最好用真实数据效果更佳。步骤 2设置环境用 Google Colab 来用免费 GPU。• 打开 Colab去colab.research.google.com。• 上传你的 JSON 文件。• 连接 T4 GPURuntime Change runtime type T4 GPU。• 安装依赖在 Colab cell 里跑!pip install unsloth[colab-new] githttps://github.com/unslothai/unsloth.git !pip install --no-deps xformers trl0.9.0 peft accelerate bitsandbytes输出安装包大概 2 分钟。如果提示重启 runtime。检查 GPUimport torch print(torch.cuda.is_available()) # 应该输出True print(torch.cuda.get_device_name(0)) # 比如 Tesla T4步骤 3加载模型选一个 base model比如 Phi-3 Mini。代码from unsloth import FastLanguageModel model_name unsloth/Phi-3-mini-4k-instruct max_seq_length 2048# 根据需要调整 model, tokenizer FastLanguageModel.from_pretrained( model_name, max_seq_lengthmax_seq_length, load_in_4bitTrue )输出下载模型小型模型大概 5-10 分钟。步骤 4预处理数据把输入格式化成单一字符串。代码import json from datasets import Dataset # 加载数据 withopen(extraction_dataset.json, r) as f: data json.load(f) # 格式化函数 defformat_prompt(item): returnf{item[input]}\n{json.dumps(item[output])}|endoftext| # 创建格式化列表 formatted_data [{text: format_prompt(item)} for item in data] dataset Dataset.from_list(formatted_data) # 打印示例 print(formatted_data[0][text])输出示例divh2Product: Laptop/h2pPrice: $999/pspanCategory: Electronics/spanspanManufacturer: Dell/span/div {name: Laptop, price: $999, category: Electronics, manufacturer: Dell}|endoftext|步骤 5添加 LoRA AdaptersLoRA 让微调更高效只训练一小部分。代码model FastLanguageModel.get_peft_model( model, r16, # Rank target_modules[q_proj, k_proj, v_proj, o_proj, gate_proj, up_proj, down_proj], lora_alpha16, lora_dropout0, biasnone, use_gradient_checkpointingunsloth, random_state3407 )输出“Unsloth: Patched 32 layers…”很快。LoRA 是什么Low-Rank Adaptation给模型加“侧挂”层只训练 ~1% 的参数省时间和内存。步骤 6训练模型用 SFTTrainer 训练。代码from trl import SFTTrainer from transformers import TrainingArguments trainer SFTTrainer( modelmodel, tokenizertokenizer, train_datasetdataset, dataset_text_fieldtext, max_seq_lengthmax_seq_length, argsTrainingArguments( per_device_train_batch_size2, gradient_accumulation_steps4, warmup_steps5, max_steps60, # 调整以训练更多 learning_rate2e-4, fp16not torch.cuda.is_bf16_supported(), bf16torch.cuda.is_bf16_supported(), logging_steps1, optimadamw_8bit, weight_decay0.01, lr_scheduler_typelinear, seed3407, output_diroutputs, ), ) trainer.train()输出进度条显示 loss 下降500 个例子大概 10 分钟。步骤 7测试推理跑个快速测试。代码FastLanguageModel.for_inference(model) messages [{role: user, content: divh2Product: Phone/h2pPrice: $500/pspanCategory: Gadgets/spanspanManufacturer: Apple/span/div}] inputs tokenizer.apply_chat_template(messages, tokenizeTrue, add_generation_promptTrue, return_tensorspt).to(cuda) outputs model.generate(inputs, max_new_tokens256, use_cacheTrue) print(tokenizer.batch_decode(outputs)[0])输出User: divh2Product: Phone/h2pPrice: $500/pspanCategory: Gadgets/spanspanManufacturer: Apple/span/div Assistant: {name: Phone, price: $500, category: Gadgets, manufacturer: Apple}如果结果不稳定多训练几次步骤 8导出到 GGUF 格式给 Ollama保存成 Ollama 支持的格式。代码model.save_pretrained_gguf(fine_tuned_model, tokenizer, quantization_methodq4_k_m)然后下载在 Colab 文件里右键下载10-20 分钟。步骤 9为 Ollama 创建 Modelfile安装 Ollama去ollama.com。在终端cd ~/Downloads mkdir ollama-test mv unsloth.Q4_K_M.gguf ollama-test/ cd ollama-test touch Modelfile nano Modelfile # 粘贴以下内容Modelfile 内容FROM ./unsloth.Q4_K_M.gguf PARAMETER temperature 0.8 PARAMETER top_p 0.9 PARAMETER stop |endoftext| TEMPLATE {{ .Prompt }} SYSTEM You are a helpful AI assistant.创建模型ollama create html-extractor -f Modelfile### 步骤 10在 Ollama 中运行ollama run html-extractorPrompt粘贴 HTML 示例。输出提取的 JSON本地运行隐私安全。最佳实践和常见问题•数据质量用多样化的例子防止 overfitting。•评估用没见过的数据测试。•扩展用更大的模型比如 Llama 3.1效果更好。•常见问题数据集太小会导致“hallucinations”多加数据微调的伦理问题• 避免偏见数据比如用多样化的数据源训练。• 隐私用匿名数据进行微调。总结微调 LLM 就像给你的 AI 项目加了个超级技能把通用工具变成专属专家按照这篇指南的简单步骤——收集好数据、设置环境、用 Unsloth 训练、用 Ollama 部署你就能打造出精准、一致的定制模型满足你的独特任务需求。不管是从 HTML 提取数据、写小众客服回复还是解决领域专属难题微调让新手也能轻松上手普通人如何抓住AI大模型的风口领取方式在文末为什么要学习大模型目前AI大模型的技术岗位与能力培养随着人工智能技术的迅速发展和应用大模型作为其中的重要组成部分正逐渐成为推动人工智能发展的重要引擎。大模型以其强大的数据处理和模式识别能力广泛应用于自然语言处理、计算机视觉、智能推荐等领域为各行各业带来了革命性的改变和机遇。目前开源人工智能大模型已应用于医疗、政务、法律、汽车、娱乐、金融、互联网、教育、制造业、企业服务等多个场景其中应用于金融、企业服务、制造业和法律领域的大模型在本次调研中占比超过30%。随着AI大模型技术的迅速发展相关岗位的需求也日益增加。大模型产业链催生了一批高薪新职业人工智能大潮已来不加入就可能被淘汰。如果你是技术人尤其是互联网从业者现在就开始学习AI大模型技术真的是给你的人生一个重要建议最后只要你真心想学习AI大模型技术这份精心整理的学习资料我愿意无偿分享给你但是想学技术去乱搞的人别来找我在当前这个人工智能高速发展的时代AI大模型正在深刻改变各行各业。我国对高水平AI人才的需求也日益增长真正懂技术、能落地的人才依旧紧缺。我也希望通过这份资料能够帮助更多有志于AI领域的朋友入门并深入学习。真诚无偿分享vx扫描下方二维码即可加上后会一个个给大家发大模型全套学习资料展示自我们与MoPaaS魔泊云合作以来我们不断打磨课程体系与技术内容在细节上精益求精同时在技术层面也新增了许多前沿且实用的内容力求为大家带来更系统、更实战、更落地的大模型学习体验。希望这份系统、实用的大模型学习路径能够帮助你从零入门进阶到实战真正掌握AI时代的核心技能01教学内容从零到精通完整闭环【基础理论 →RAG开发 → Agent设计 → 模型微调与私有化部署调→热门技术】5大模块内容比传统教材更贴近企业实战大量真实项目案例带你亲自上手搞数据清洗、模型调优这些硬核操作把课本知识变成真本事‌02适学人群应届毕业生‌无工作经验但想要系统学习AI大模型技术期待通过实战项目掌握核心技术。零基础转型‌非技术背景但关注AI应用场景计划通过低代码工具实现“AI行业”跨界‌。业务赋能突破瓶颈传统开发者Java/前端等学习Transformer架构与LangChain框架向AI全栈工程师转型‌。vx扫描下方二维码即可本教程比较珍贵仅限大家自行学习不要传播更严禁商用03入门到进阶学习路线图大模型学习路线图整体分为5个大的阶段04视频和书籍PDF合集从0到掌握主流大模型技术视频教程涵盖模型训练、微调、RAG、LangChain、Agent开发等实战方向新手必备的大模型学习PDF书单来了全是硬核知识帮你少走弯路不吹牛真有用05行业报告白皮书合集收集70报告与白皮书了解行业最新动态0690份面试题/经验AI大模型岗位面试经验总结谁学技术不是为了赚$呢找个好的岗位很重要07 deepseek部署包技巧大全由于篇幅有限只展示部分资料并且还在持续更新中…真诚无偿分享vx扫描下方二维码即可加上后会一个个给大家发

京东当前网站做的营销活动wordpress调用子目录名称

个人建网站需要多少钱客户关系管理软件有哪些

男人互做网站wordpress 伪静态 404

公司做网站广告语河北seo基础

青岛谁家做网站策划咨询

网站软件资源官网seo优化找哪家做

临沂网站制作计划基于html做电商网站论文