OIdiot

OIdiot

卷积神经网络入门
Tech

卷积神经网络入门

传统神经网络模型不能很好适应整张2维图片。比如一张 32×32×3(长32-宽32-RGB) 的彩色图片,在传统模型中第一层输入为了读入整张图片就需要 32×32×3 = 3072 个神经元,也就是有 3027 组参数,在这个简单的小图数据集(比如 CIFAR-10)好像看上去还能接受,但是一旦图片变成 200×200 的分辨率,就有 120,000 组参数了,这显然是训练时难以接受的。
11 min read
爬爬爬 —— BeautifulSoup 还是 Scrapy?
Tech

爬爬爬 —— BeautifulSoup 还是 Scrapy?

为什么写这篇短文 1. 最近在做一个 DL×CV 的 proj,需要大量的广东美食图片数据,刚好写一发爬虫。 2. 发现身边很多同学突然看起了 python,而上手 proj 就是写爬虫,然而网上资料纷繁复杂,纠结是用 bs 还是 scrapy。 这里的介绍非常简要,涉及深层姿势的部分请出门右拐官网。 一些背景姿势 在 bs 和 scrapy 之间做选择前,首先当然要了解他们是什么,差别何在。 * Scrapy 是一个非常成熟的工具包,你只要写很少的东西就能达到你要的效果——创建一个 spider 下载网页并提取其中有用的数据。 * BeautifulSoup 则是一个面向网页的工具,它能够解析 DOM 树并提取某些特定的节点(比如 ,

等)。 也就是说,只用 bs 是做不了爬虫的,必须要引入 requests 之类的包用来下载网页,

3 min read