Kaggle
入门
本来打算把kaggle入门归类到我们的tech文件夹中,但是想到未来还要有很多的博客关于kaggle,就直接开了一个文件夹。
如何使用kaggle
下载数据集
模型求解
提交数据 -> 得到分数
优化模型,尝试获得更高的分数
最终得到排名
官方比赛介绍
参加比赛 阅读挑战说明,接受比赛规则并访问比赛数据集。
开始工作 下载数据,在本地或 Kaggle Notebooks(我们无需设置、可自定义的 Jupyter Notebooks 环境,带有免费 GPU)上构建模型,并生成预测文件。
提交 :将您的预测作为提交上传到 Kaggle 上,并获得准确度分数。
查看排行榜...
more...
kaggle泰坦尼克号问题
第一个问题,翻译页面只翻译了一部分,重要的教程部分还是英文。强行锻炼了我的英语能力
无法独立完成
先看 3 篇高赞 Notebook,总结 “通用流程” 比如泰坦尼克号题目,高赞思路通常是:
理解数据(查看特征含义、样本量、数据类型)
探索性分析(画分布图看特征与目标的关系,比如 “性别是否影响生存”)
数据预处理(处理缺失值、编码分类特征、删除无用特征)
简单建模(用逻辑回归、决策树等基础模型)
模型评估与调优(用交叉验证看准确率,调整参数) 把这个流程记在笔记本上,作为自己的 “行动框架”。
逐行模仿代码,搞懂 “每个步骤的目的”...
more...
7月31日日记
博客
看着文件夹里的md文件越来越多,很有成就感
上班的时候只要看教学时频或者看字幕双眼迷离了就开始捣鼓博客,可以提神。因为听人讲可有时候不动脑子,很快就会困了(总之还是注意力不集中呗)
我要给我的博客定一个标准:比如我每次记录的时间节点是什么。目前有每天的日记,还有一篇年度总结,但是我想每个月也可以写,每个学期也可以写,每个学年也可以写。虽说有点乱吧。
一会如果吃完饭还有时间我要写一个以学年为单位的总结,后面找时间补7月的总结
学习
今天学习了一些线性规划的有关知识,我发现在数据分析这个领域的某些概念并不和学科中的大概念相同,或者说,数据分析这个更注重实践的领域,其实了解这个东西是如何运作...
more...
轴承故障的振动分析学习总结
STFT:短时傅里叶变换傅里叶变换的意义:把一个随时间变化的信号(时域信号),转换成一个由频率组成的信号(频域信号)
但是傅里叶变换只能知道这个信号里有哪些频率,并不知道这些频率什么时候出现,短时傅里叶变换可以知道在一个较短的时间段内存在哪些频率,由此知道在时间顺序上,哪一段有哪个频率的信号,
比喻理解:
比如一首歌:前5秒是低音节奏接下来的5秒是高音独奏,你如果只做傅里叶变换,你只会知道「有低音也有高音」,却不知道「低音在前,高音在后」。这就好像:你只知道一道菜用了哪些调料,但不知道它们是什么时候加进去的。
理解:短时傅里叶变换弥补了傅里叶变换没有时间内定位能力的缺点,在实际应用中更加实用
...
more...
Python Demo
这是一个 Python 基础语法演示,包含复数运算、字符串格式化等内容。
from calendar import day_name
print((1+4j) ** 2)
print((1+4j)*(1-4j))
#此处的1+4j是复数,虚数单位用j表示
a = type(1+4j)
b = type(a)
print(a)
print(b)
#用type函数查看变量a和b的类型,并输出
print("100整除2得:%d" % (100%2))
#用 %d 来充当整数的占位符,用%f充当浮点数占位符,用%s充当字符串占位符
name =...
more...









