LEMON的博客


  • 首页

  • 标签

  • 分类

  • 归档

  • 搜索

这里是目录

发表于 2048-03-18 | 更新于: 2018-04-12
字数统计: 48字
  • Kaggle
  • 数据挖掘
  • 人脸识别相关
  • 深度学习与神经网络-吴恩达
  • 机器学习实战系列
  • 机器学习相关库
    阅读全文 »

软考知识点

发表于 2018-04-16 | 更新于: 2018-05-23 | 分类于 软考
字数统计: 9,843字

计算机组成与结构

计算机中数据的表示

数值数据的表示

  • 定点数:所有数据的小数点位置是固定的,小数点位置在数据最高位是定点小数,在最低位是定点整数,会有溢出的情况发生
  • 浮点数:阶符,阶码,数符,尾数 组成, 尾数决定精度,阶码决定数据范围,最适合浮点数阶码的数字编码是移码

数的机器码表示

  • 原码:符号位表示该数的符号,0正1负 。原码中分+0和-0
  • 反码:符号位表示法和原码一样,正数不变,负数要取反(除掉符号位)
  • 补码:正数和原码相同,负数=反码加一,最适合加减运算的数字编码
  • 移码:在数X上增加一个偏移量来定义的,常用于表示浮点数的阶码部分,如果机器字长n,规定偏移量是2的n-1次方,
  • 移码定义:
阅读全文 »

Kaggle比赛入门-房价预测

发表于 2018-03-21 | 更新于: 2018-04-12 | 分类于 Kaggle
字数统计: 561字

步骤

  1. 获取数据
  2. 探究数据(可视化+清洗)
  3. 设计并转换特征和目标变量
  4. 建立一个模型
  5. 制作并提交预测

获取数据

探究数据

查看目标函数与理解相关业务

1
2
3
4
5
6
plt.figure()
plt.subplot(1,2,1)
plt.hist(train.SalePrice, color='blue')
plt.subplot(1,2,2)
plt.hist(target, color='blue')
plt.show() # 展示

mark

阅读全文 »

Tensorflow+opencv2实现人脸识别

发表于 2018-03-13 | 更新于: 2018-04-11 | 分类于 人脸检测
字数统计: 728字

配置

  • python3
  • Tensorflow
  • opencv2

步骤

  1. 获取并显示摄像头实时视频&读取本地视频
  2. 从实时视频流中识别出人脸区域
  3. 准备人脸数据
  4. 建立CNN(卷积神经网络)模型
  5. 利用keras库训练人脸识别模型
  6. 利用训练数据进行识别人脸
    阅读全文 »

第四章-深度神经网络优化(梯度下降法)

发表于 2018-03-07 | 更新于: 2018-04-17 | 分类于 深度学习与神经网络(吴恩达)
字数统计: 1,800字

梯度下降法

批梯度下降法(BGD)

批梯度下降法(Batch Gradient Descent,BGD是最常用的梯度下降形式,前面的Logistic回归及深层神经网络的构建中所用到的梯度下降都是这种形式。其在更新参数时使用所有的样本来进行更新,具体过程为:

公式

\[{X = [x^{(1)},x^{(2)},…,x^{(m)}]}\] \[z^{[1]} = w^{[1]}X + b^{[1]}\] \[a^{[1]} = g^{[1]}(z^{[1]})\] \[… \ …\]

阅读全文 »

第五章-Tensorflow

发表于 2018-03-07 | 更新于: 2018-03-11 | 分类于 深度学习与神经网络(吴恩达)
字数统计: 520字

Tensorflow

基本流程

步骤

  • 创建尚未执行/评估的张量(变量)
  • 在这些张量之间写入操作
  • 初始化你的张量
  • 创建一个会话
  • 运行会话。这将运行你上面写的操作 eg:初始化你的变量,创建一个会话并在会话中运行这些操作

例子

1
2
3
4
5
6
7
8
9
10
# 初始化变量
a = tf.constant(2)
b = tf.constant(10)
c = tf.multiply(a,b)
print(c)
-->Tensor("Mul_1:0", shape=(), dtype=int32)
# 运行会话
sess = tf.Session()
print(sess.run(c))
-->20
阅读全文 »

第四章-深度神经网络优化(初始化&正则化)

发表于 2018-03-04 | 更新于: 2018-03-07 | 分类于 深度学习与神经网络(吴恩达)
字数统计: 861字

权重初始化

作用

  • 随机初始化以破坏对称性
  • 加快渐变下降的收敛速度
  • 增加梯度下降收敛到较低训练(和泛化)错误的几率

参数都初始化为零

  • 导致网络无法破坏对称性:这意味着每一层中的每个神经元都会学到相同的值。对于每一层而言,网络并不比线性分类器更强大,如逻辑回归。 mark
    阅读全文 »

分析伯乐在线文章数据

发表于 2018-02-15 | 更新于: 2018-02-19 | 分类于 数据挖掘
字数统计: 458字

一、读取文章数据

pandas读取mysql数据到DataFrame中

1
2
3
4
5
6
7
8
9
10
11
import pandas as pd
from sqlalchemy import create_engine

db_info = {'user':'root',
'password':'',
'host':'localhost',
'database':'article_spider'
}
engine = create_engine('mysql://%(user)s:%(password)s@%(host)s/%(database)s?charset=utf8' % db_info,encoding='utf-8')
sql = 'select * from jobbole_article;'
df = pd.read_sql(sql , con = engine)
阅读全文 »

matplotlib画图(基础)

发表于 2018-01-28 | 更新于: 2018-03-21 | 分类于 Python基础
字数统计: 1,321字

基本使用

基本格式

1
2
3
4
5
6
7
8
9
import matplotlib.pyplot as plt
import numpy as np

x = np.linspace(-1, 1, 50)
y = 2*x + 1

plt.figure(num=3, figsize=(8, 5),)
plt.plot(x, y)
plt.show()
  • np.linspace:定义x:范围是(-1,1);个数是50. 仿真一维数据组(x ,y)表示曲线1.
  • plt.figure:定义一个图像窗口,小窗口里面还可以有更多的小图片。这里定义一个图像窗口:编号为3;大小为(8, 5)
  • plt.plot:画(x ,y)曲线.
  • plt.show:显示图像. mark

    阅读全文 »

matplotlib画图(进阶)

发表于 2018-01-28 | 更新于: 2018-03-21 | 分类于 Python基础
字数统计: 130字

多图合一显示

Subplot 多合一显示

均匀图中图

1
2
3
4
5
6
7
8
9
10
11
import matplotlib.pyplot as plt

plt.figure()

plt.subplot(1,2,1)
plt.plot([0,1],[0,1])

plt.subplot(1,2,2)
plt.plot([0,1],[0,2])

plt.show() # 展示
  • plt.figure:定义一个图像窗口,小窗口里面还可以有更多的小图片。
  • plt.subplo(x, y, n):表示将整个图像窗口分为x行y列,当前位置为n 可简写为plt.subplo(xyn)
  • plt.plot:画(x ,y)曲线.

mark

阅读全文 »
12…5
LEMON

LEMON

没有什么是一蹴而就的

47 日志
18 分类
19 标签
GitHub 简书
© 2017 — 2018 LEMON
由 Hexo 强力驱动
|
本站访客数:次
|
博客全站共53.2k字