1296 words 1 mins.

先发制人!邮件已经发出,现在要做的是**“老师一旦回复,我立刻能进入状态”**的准备。下面给你一份「大二进组专用」的 4 周冲刺清单,全部围绕机器学习 / 数据分析方向,分“基础补漏 → 工具熟练 → 小项目实战 → 文献/科研礼仪”四层推进。你可以按周完成,也可并行。 🔹 Week 0(现在就能做) 把环境搭好 本地:Anaconda + JupyterLab / VS Code 远程:Google Colab(GPU)、Kaggle Notebook GitHub 新建仓库...
529 words 1 mins.

周五 周五晚回家了,依旧一个半小时高铁 晚上很累,本来想着回家倒头就睡来着,...
621 words 1 mins.

主要用来记录一些留学相关信息,相当于一个记事本吧
325 words 1 mins.

入门 本来打算把kaggle入门归类到我们的tech文件夹中,但是想到未来还要有很多的博客关于kaggle,就直接开了一个文件夹。 如何使用kaggle 下载数据集 模型求解 提交数据 -> 得到分数 优化模型,尝试获得更高的分数 最终得到排名 官方比赛介绍 参加比赛 阅读挑战说明,接受比赛规则并访问比赛数据集。 开始工作 下载数据,在本地或 Kaggle Notebooks(我们无需设置、可自定义的 Jupyter Notebooks 环境,带有免费 GPU)上构建模型,并生成预测文件。 提交 :将您的预测作为提交上传到 Kaggle 上,并获得准确度分数。 查看排行榜...
499 words 1 mins.

第一个问题,翻译页面只翻译了一部分,重要的教程部分还是英文。强行锻炼了我的英语能力 无法独立完成 先看 3 篇高赞 Notebook,总结 “通用流程” 比如泰坦尼克号题目,高赞思路通常是: 理解数据(查看特征含义、样本量、数据类型) 探索性分析(画分布图看特征与目标的关系,比如 “性别是否影响生存”) 数据预处理(处理缺失值、编码分类特征、删除无用特征) 简单建模(用逻辑回归、决策树等基础模型) 模型评估与调优(用交叉验证看准确率,调整参数) 把这个流程记在笔记本上,作为自己的 “行动框架”。 逐行模仿代码,搞懂 “每个步骤的目的”...
122 words 1 mins.

RNN Recurrent Neural Network(循环神经网络) 有记忆的神经网络,但是记忆太短,容易出错 LSTM Long Short-Term Memory(长短期记忆) 有三个门来控制记忆,还可以选择删除哪些记忆 遗忘门、输入门、输出门 具有时间顺序
227 words 1 mins.

分类和回归 分类的目的是预测离散的类别标签 回归的目的是预测连续的类别标签 例如gradient boosting 梯度提升模型,既可以在分类问题中使用,也可以在回归问题中使用 梯度提升是一个通用的机器学习框架,不仅限于回归: 回归版本: GradientBoostingRegressor 损失函数: 平方损失、绝对损失等 输出: 连续数值 分类版本: GradientBoostingClassifier 损失函数: 对数损失 (log-loss)、指数损失等 输出: 类别概率 → 类别预测
96 words 1 mins.

非线性规划定义 当目标函数和约束条件中有一个是决策变量x的非线性表达式时,这个数学求解问题是非线性规划问题。 解法目前没有统一的解法,都是在选定决策变量的初始值之后搜索方法 标准型 目标函数为求最小值
990 words 1 mins.

博客 看着文件夹里的md文件越来越多,很有成就感 上班的时候只要看教学时频或者看字幕双眼迷离了就开始捣鼓博客,可以提神。因为听人讲可有时候不动脑子,很快就会困了(总之还是注意力不集中呗) 我要给我的博客定一个标准:比如我每次记录的时间节点是什么。目前有每天的日记,还有一篇年度总结,但是我想每个月也可以写,每个学期也可以写,每个学年也可以写。虽说有点乱吧。 一会如果吃完饭还有时间我要写一个以学年为单位的总结,后面找时间补7月的总结 学习 今天学习了一些线性规划的有关知识,我发现在数据分析这个领域的某些概念并不和学科中的大概念相同,或者说,数据分析这个更注重实践的领域,其实了解这个东西是如何运作...
789 words 1 mins.

线性规划的定义 一个优化问题,如果其所有表达式(条件,目标,约束)都是线性的,那么它就是线性规划。 例题 游戏每天提供 100 点体力,可通过通关 A、B、C 三张地图获取经验升级。 通关奖励与消耗: A 地图:20 点经验 / 次,消耗 4 点体力 / 次 B 地图:30 点经验 / 次,消耗 8 点体力 / 次 C 地图:45 点经验 / 次,消耗 15 点体力 / 次 约束条件:A、B、C 三张地图每天通关总次数最多 20...