首先先强调一点很容易混淆的点:

  • 一个shape为(4,)的np.array其实是一行!!一行4列!!而不是4行每行1个元素!!
  • 上面说的这个👆array假设叫x,那么想把x加到一个shape为(9,4)的matrix上是可以直接加的,如果想要把x加到一个shape为(4,9)的matrix上要先转置!而且不能直接转置,因为一个array的转置的形状是不会变的。。正确做法是:先把x变成一个数组,之后再对这个数组转置,这时候x的形状就已经变成了(4,1),成了真正的4行每行1列,也就可以把它加到shape为(4,9)的matrix上去喽~

在我们所以Numpy的过程中,常常会有大量的矩阵数组需要运算,但是不同类型的Numpy怎样进行加减乘除呢?这就要用到我们Numpy的广播。

Read more »

局部二值模式(英文:Local binary patterns,缩写:LBP)

在最简简化的情况下,局部二值模式特征向量可以通过如下方式计算:

  • 将检测窗口切分为区块(cells,例如,每个区块16x16像素)。

  • 对区块中的每个像素,与它的八个邻域像素进行比较(左上、左中、左下、右上等)。可以按照顺时针或者逆时针的顺序进行比较。

  • 对于中心像素大于某个邻域的,设置为1;否则,设置为0。这就获得了一个8位的二进制数(通常情况下会转换为十进制数字),作为该位置的特征。

Read more »

由下图可以大致看出KD-Tree的构造方式:

首先问题是隶属于分类问题的。每个sample有若干个属性(axis),如(3,4)就是一个有两个属性的sample。我们按axis=0,1,2,…的方式分别寻找每个维度(属性)的中位数并分别划分开来,就得到了一个树状结构,这样预测一个新的数据点的时候就可以很方便的按照树状结构将其归位到某个分区里去,而不用花费大量的计算资源去计算距离了。

Useful Words

  • 电信学院:School of Electronic Information and Communication

  • 光电学院:School of Optical and Electronic Information

  • 由…组成:be composed of/ be made up of

  • 种子班:Undergraduate Program for Advanced Project-based Information Science Education (Seeds Class)

Read more »

CS231N 第一课

History

  • 在深度学习没有出现之前,处理图片的一个重要技术是分割图片。当时最好的算法有Normalized Cut等。

  • SIFT(Scale-invariant feature transform):一种检测局部特征的算法,该算法通过求一幅图中的特征点(interest points,or corner points)及其有关scale 和 orientation 的描述子得到特征并进行图像特征点匹配,获得了良好效果,主要可以应用与物体检测。通过提取一些不会根据拍摄者的角度、远近变化的特征来确定目标。

Read more »

LSTM模型简介

整体认识:

  • 下图是LSTM模型的基本“细胞”,在处理一个句子时,每个单词都对应一个“细胞”。

Read more »

点石创校第一课理论部分笔记

书籍推荐

  • 《从0到1》:在现今创业的大的浪潮中,在什么想法上你和身边其他人完全不一样。差异化是判断一个项目和一个创业者能力的最重要的点。下载链接: 密码:zbed
  • 《蓝海战略》:蓝海市场:用户的某种渴望尚没有被满足的市场(或不准确的说,还没有被巨头们争夺的市场)
Read more »

项目介绍

  • **原则:**不要让观众死一个脑细胞

  • 短句子,说人话。不用复杂的定语和倒装句,不用专业名词,要让在场的听众,老百姓们不懂项目中的具体细节

  • 不要用容易引起误解或是听不清楚的词句,如P2P,容易被误解为P2B、B2B等

  • 不要用目前有一定负面性质的字眼,比如目前的P2P,不说为好

  • 不要说一些傲慢和现在还没有实现的话,比如“我们定义了…”

  • 不要在如此短的时间里说“我们…”等无意义的话

  • 要点出投资人关心的Point,如谁出钱,咋盈利

Read more »

OKR 初认识

  • O是Objective,KR是Key Results。每个项目组的O是其当前的主要目标,比如把准确率提升至80%;KR是关键目标,比如要继续调研多少种模型。
  • KR记住一定要加上时间节点进去
  • O一般不超过4个,每个O下面对应的KR最多也不超过4个
  • 年度目标,季度目标,每周目标,每日目标
  • 最好70%完成度的目标比较合适,可以使得任务的完成度充分拉伸
  • 关键是要有一个具体的数据并且要起到激励作用,而不要使用副词“大幅度”,“尽量”等

2018.3.18 刚哥指导

  • 后续的清洗数据工作:

    1. 先用正则匹配将唯一能匹配到knowledge中的某个pattern的问题自动打上标签
    2. 然后判断是否属于某些较大且正确率较高的主问题,如果结果正确,直接打上标签
    3. 把余下的归属于某些小问题的log分配给人工打
Read more »
0%