最新发布 第4页

Alan Hou的个人博客用行动赢得尊重

Coding

Transformers自然语言处理第二章 文本分类

Transformers自然语言处理第二章 文本分类
其它章节内容请见机器学习之PyTorch、Scikit-Learn和Transformers代码参数GitHub仓库文本分类是自然语言处理中最常见的任务之一,它可用于各种应用,例如将客户反馈标记为不同的类别,或者根据语言分发工单。电子邮件程序的垃圾邮件过滤器很有可能正在使用文本分类来保护收件箱免受大量不需要的垃圾邮件的侵扰!另一种常见的文本分类是情感分……继续阅读 »

Alan 10个月前 (06-17) 905浏览 0评论0个赞

Coding

Transformers自然语言处理第一章 你好Transformer

Transformers自然语言处理第一章 你好Transformer
其它章节内容请见机器学习之PyTorch、Scikit-Learn和Transformers代码参见GitHub仓库2017年,Google的研究人员发表了一篇论文,提出了一种新的用于序列建模(sequence modeling)的神经网络架构[1]。称之为Transformer,这种架构在机器翻译任务中的表现无论在翻译质量还是训练成本层面均优于循环神经……继续阅读 »

Alan 10个月前 (06-16) 1055浏览 0评论0个赞

Coding

云原生系列Go语言篇-标准库

云原生系列Go语言篇-标准库
本文来自正在规划的Go语言&云原生自我提升系列,欢迎关注后续文章。使用Go进行开发的最大优势之一是其标准库。与Python类似,Go也采取了“内置电池”的理念,提供了构建应用程序所需的许多工具。由于Go是一种相对较新的语言,它附带了一个专注于现代编程环境中遇到的问题的库。我们无法涵盖所有标准库包,所幸也不需要,因为有许多优秀的信息源可以了解标准库……继续阅读 »

Alan 11个月前 (06-09) 808浏览 0评论0个赞

Coding

第7章 组合不同的模型进行集成学习

第7章 组合不同的模型进行集成学习
其它章节内容请见机器学习之PyTorch和Scikit-Learn上一章中,我们专注于调优和评估不同的分类模型的最佳实践。本章中,我们将基于这些技术,并探索构建一组分类器的方法,这些方法通常比各个成员具备更好的预测性能。本章我们学习的主要内容有:基于多数投票做出预测使用装袋法重复从训练数据集中随机抽取组合降低过拟合应用提升方法通过弱学习器构建强大的……继续阅读 »

Alan 11个月前 (06-08) 864浏览 0评论0个赞

Coding

如何实现ChatGPT的打字机效果

如何实现ChatGPT的打字机效果
体验过 OpenAI的ChatGPT的朋友们应该都会发现交谈的内容都是一个字一个字蹦出来的,熟悉其背后原理的朋友都知道除了一些预先调校的回复实际上AI的回复都是实时生成的,或者更专业的说法应该是实时预测出来的。所以这种显示效果也是一种无奈之举,但小伙伴有没有发现其实它还蛮酷的,至少不太容易让人产生反感。既然内容是实时生成的,那自然是后端接口实时喂数据给前端……继续阅读 »

Alan 11个月前 (06-06) 1078浏览 0评论0个赞

HTML5&CSS3

Nuxt 3和Naive UI踩坑及经验分享

Nuxt 3和Naive UI踩坑及经验分享
Nuxt为Nuxt3启用了全新域名https://nuxt.com/(原域名为https://nuxtjs.org/),Alan没有深度使用过Nuxt 2,但变化应该还是比较大的,因为Nuxt 3正式版与之前的beta版本都有不小的变化。选择Nuxt 的主要原因应该都是SEO吧,毕竟官方的SSR方案尤雨溪自己都说不完善。当然对于的约定大于配置的理念也是褒贬不……继续阅读 »

Alan 12个月前 (05-08) 1381浏览 0评论0个赞

Python

第6章 学习模型评估和超参数调优的最佳实践

第6章 学习模型评估和超参数调优的最佳实践
其它章节内容请见机器学习之PyTorch和Scikit-Learn在前面的章节中,我们学习了用于分类的基本机器学习算法以及如何在喂给这些算法前处理好数据。下面该学习通过调优算法和评估模型表现来构建良好机器学习模型的最佳实践了。本章中,我们将学习如下内容:评估机器学习模型表现诊断机器学习算法常见问题调优机器学习模型使用不同的性能指标评估预测模型……继续阅读 »

Alan 12个月前 (04-25) 1551浏览 0评论0个赞

Python

第5章 通过降维压缩数据

第5章 通过降维压缩数据
其它章节内容请见机器学习之PyTorch和Scikit-Learn在第4章 构建优秀的训练数据集 – 数据预处理中,我们学习了使用特征选择技术对数据集降维的不同方法。特征选择以外的另一种降维方法是特征提取。本章中我们会学习两种基本技术,可帮助我们通过将其变换为比原来更低维度的特征子空间总结出数据集中的信息内容。数据压缩是机器学习中非常重要的课题,它有助于我……继续阅读 »

Alan 1年前 (2023-04-17) 2196浏览 0评论0个赞

Python

第4章 构建优秀的训练数据集 – 数据预处理

第4章 构建优秀的训练数据集 – 数据预处理
其它章节内容请见机器学习之PyTorch和Scikit-Learn数据质量及所包含的有用信息量是决定机器学习算法能学到多好的关键因素。因此,在将数据集喂给机器学习算法前对其进行检查和预处理绝对很重要。本章中,我们会讨论一些基本数据预处理技术,有助于我们构建很好的机器学习模型。本章将要讨论的内容有:删除和替换数据集缺失值为机器学习算法准备分类数据为……继续阅读 »

Alan 1年前 (2023-04-08) 2917浏览 0评论0个赞