325 words 1 mins.

入门 本来打算把kaggle入门归类到我们的tech文件夹中,但是想到未来还要有很多的博客关于kaggle,就直接开了一个文件夹。 如何使用kaggle 下载数据集 模型求解 提交数据 -> 得到分数 优化模型,尝试获得更高的分数 最终得到排名 官方比赛介绍 参加比赛 阅读挑战说明,接受比赛规则并访问比赛数据集。 开始工作 下载数据,在本地或 Kaggle Notebooks(我们无需设置、可自定义的 Jupyter Notebooks 环境,带有免费 GPU)上构建模型,并生成预测文件。 提交 :将您的预测作为提交上传到 Kaggle 上,并获得准确度分数。 查看排行榜...
227 words 1 mins.

分类和回归 分类的目的是预测离散的类别标签 回归的目的是预测连续的类别标签 例如gradient boosting 梯度提升模型,既可以在分类问题中使用,也可以在回归问题中使用 梯度提升是一个通用的机器学习框架,不仅限于回归: 回归版本: GradientBoostingRegressor 损失函数: 平方损失、绝对损失等 输出: 连续数值 分类版本: GradientBoostingClassifier 损失函数: 对数损失 (log-loss)、指数损失等 输出: 类别概率 → 类别预测
499 words 1 mins.

第一个问题,翻译页面只翻译了一部分,重要的教程部分还是英文。强行锻炼了我的英语能力 无法独立完成 先看 3 篇高赞 Notebook,总结 “通用流程” 比如泰坦尼克号题目,高赞思路通常是: 理解数据(查看特征含义、样本量、数据类型) 探索性分析(画分布图看特征与目标的关系,比如 “性别是否影响生存”) 数据预处理(处理缺失值、编码分类特征、删除无用特征) 简单建模(用逻辑回归、决策树等基础模型) 模型评估与调优(用交叉验证看准确率,调整参数) 把这个流程记在笔记本上,作为自己的 “行动框架”。 逐行模仿代码,搞懂 “每个步骤的目的”...
122 words 1 mins.

RNN Recurrent Neural Network(循环神经网络) 有记忆的神经网络,但是记忆太短,容易出错 LSTM Long Short-Term Memory(长短期记忆) 有三个门来控制记忆,还可以选择删除哪些记忆 遗忘门、输入门、输出门 具有时间顺序
96 words 1 mins.

非线性规划定义 当目标函数和约束条件中有一个是决策变量x的非线性表达式时,这个数学求解问题是非线性规划问题。 解法目前没有统一的解法,都是在选定决策变量的初始值之后搜索方法 标准型 目标函数为求最小值
990 words 1 mins.

博客 看着文件夹里的md文件越来越多,很有成就感 上班的时候只要看教学时频或者看字幕双眼迷离了就开始捣鼓博客,可以提神。因为听人讲可有时候不动脑子,很快就会困了(总之还是注意力不集中呗) 我要给我的博客定一个标准:比如我每次记录的时间节点是什么。目前有每天的日记,还有一篇年度总结,但是我想每个月也可以写,每个学期也可以写,每个学年也可以写。虽说有点乱吧。 一会如果吃完饭还有时间我要写一个以学年为单位的总结,后面找时间补7月的总结 学习 今天学习了一些线性规划的有关知识,我发现在数据分析这个领域的某些概念并不和学科中的大概念相同,或者说,数据分析这个更注重实践的领域,其实了解这个东西是如何运作...
789 words 1 mins.

线性规划的定义 一个优化问题,如果其所有表达式(条件,目标,约束)都是线性的,那么它就是线性规划。 例题 游戏每天提供 100 点体力,可通过通关 A、B、C 三张地图获取经验升级。 通关奖励与消耗: A 地图:20 点经验 / 次,消耗 4 点体力 / 次 B 地图:30 点经验 / 次,消耗 8 点体力 / 次 C 地图:45 点经验 / 次,消耗 15 点体力 / 次 约束条件:A、B、C 三张地图每天通关总次数最多 20...
1759 words 2 mins.

STFT:短时傅里叶变换傅里叶变换的意义:把一个随时间变化的信号(时域信号),转换成一个由频率组成的信号(频域信号) 但是傅里叶变换只能知道这个信号里有哪些频率,并不知道这些频率什么时候出现,短时傅里叶变换可以知道在一个较短的时间段内存在哪些频率,由此知道在时间顺序上,哪一段有哪个频率的信号, 比喻理解: 比如一首歌:前5秒是低音节奏接下来的5秒是高音独奏,你如果只做傅里叶变换,你只会知道「有低音也有高音」,却不知道「低音在前,高音在后」。这就好像:你只知道一道菜用了哪些调料,但不知道它们是什么时候加进去的。 理解:短时傅里叶变换弥补了傅里叶变换没有时间内定位能力的缺点,在实际应用中更加实用 ...
682 words 1 mins.

这是一个 Python 基础语法演示,包含复数运算、字符串格式化等内容。 from calendar import day_name print((1+4j) ** 2) print((1+4j)*(1-4j)) #此处的1+4j是复数,虚数单位用j表示 a = type(1+4j) b = type(a) print(a) print(b) #用type函数查看变量a和b的类型,并输出 print("100整除2得:%d" % (100%2)) #用 %d 来充当整数的占位符,用%f充当浮点数占位符,用%s充当字符串占位符 name =...
511 words 1 mins.

博客 大概就是博客的搭建越来越完善,非常开心,看着博客里的文章一点点变多,非常有成就感。明天要把csdn中的所有日记都导出md挂到我的网站上,那个时候网页的内容就丰富多了。 学了一点点md语法,我认为写博客是完全够用了。 现在存在的问题就是前端的东西看不太懂,对UI的美化还是有些依赖AI,缺点很明显,很容易像上次一样被ai直接全搞砸了。 实习 学了python的部分基本语法,明天争取上午快速过完,然后再看看excel,不能太墨迹,要不然一个暑假很快过去了什么也学不到。 感觉贾总的公司的人们业务能力都不是很强,我在的这段时间好像闯祸两次了,就是遇到问题就停滞,甚至不跟上级汇报。很呆呆的感觉,可...