OIdiot's Blog

OIdiot's Blog

Sign in Subscribe

torchtracer：一个管理 PyTorch AI 实验项目的工具

Machine Learning

torchtracer：一个管理 PyTorch AI 实验项目的工具

在使用 pytorch 框架进行机器学习（尤其是深度学习）实验时，经常需要考虑如何保存以下实验数据： - 模型的 checkpoints - 每次训练的 hyper-parameters - 训练过程中的各种变化参数及其图像（loss, accuracy, learning-rate 等）除此之外，[Keras](https://keras.io/) 之类的其他框架在 fit 时会有一个表示训练进度的进度条，而 pytorch 原生并没有。

使用 travis 自动部署 vuejs 项目

使用 travis 自动部署 vuejs 项目

什么是 Travis？ Travis 是一个在线的软件持续集成服务，与 GitHub 之间有着良好的协同关系。这篇记录将会以 mdzz-web 这个 vuejs 项目举例。 vuejs 项目的手动部署如果不用 travis，对于一个 vuejs 项目来说，大概有这两种部署方式：开发环境打包在开发机上打包出静态文件，再将 dist 上传到生产环境。 npm install npm run build rsync ./dist/* @: 生产环境打包在生产环境中拉取仓库，打包，再拷贝到目标路径。 npm install npm run build cp ./dist/* 这样做并不复杂，但是想让集成过程更加自动化（比如自动测试）

CTF 试题初体验

被逗哥(@Hustcw)安利了一波 CTF 赛，作为萌新我决定找点题目练练手。什么是 CTF？ CTF（Capture The Flag）中文一般译作夺旗赛，在网络安全领域中指的是网络安全技术人员之间进行技术竞技的一种比赛形式。其大致流程是，参赛团队之间通过进行攻防对抗、程序分析等形式，率先从主办方给出的比赛环境中得到一串具有一定格式的字符串或其他内容，并将其提交给主办方，从而夺得分数。 CTF 主要分为3类比赛模式：一、解题模式（Jeopardy）在解题模式CTF赛制中，参赛队伍可以通过互联网或者现场网络参与，这种模式的CTF竞赛与ACM编程竞赛、信息学奥赛比较类似，以解决网络安全技术挑战题目的分值和时间来排名，通常用于在线选拔赛。题目主要包含逆向、漏洞挖掘与利用、Web渗透、密码、取证、隐写、安全编程等类别。二、攻防模式（Attack-Defense）在攻防模式CTF赛制中，参赛队伍在网络空间互相进行攻击和防守，挖掘网络服务漏洞并攻击对手服务来得分，修补自身服务漏洞进行防御来避免丢分。攻防模式CTF赛制可以实时通过得分反映出比赛情

numpy-100，上手numpy的百题斩

numpy-100，上手numpy的百题斩

什么是 numpy-100？ numpy-100 是一个练习集，来源于 numpy 的邮件列表、stackoverflow 以及 numpy 的官方文档。其目的是为了给新手（如果老玩家也需要的话）提供方便快捷的查询及相关练习。开始做题吧 1. 导入 numpy 包并命名为 np (★☆☆) import numpy as np 2. 查看 numpy 版本及配置信息 (★☆☆) print(np.__version__) np.show_config() 3. 建立一个 10 维的零向量 (★☆☆) x = np.zeros(10) print(x) 4. 获取某个 ndarray 占用的内存大小 (★☆☆) x = np.

Fedora 安装并破解 StarUML 2.8.1

Fedora 安装并破解 StarUML 2.8.1

示例系统环境 * Fedora 27 * x86_64 你需要准备 * 下载 StarUML ，这里以 StarUML-v2.8.1-64-bit.deb 为例。 * 下载 libgcrypt。安装 StarUML 解压 deb ar vx ./StarUML-v2.8.1-64-bit.deb tar -xf ./data.tar.xz 解决一些依赖问题 sudo dnf install binutils systemd-libs rpm -Uvh libgcrypt11-1.4.4-5.1.x86_64.rpm 如果不存在 /usr/lib64/libudev.

在 pytorch 中建立自己的图片数据集

在 pytorch 中建立自己的图片数据集

通常情况下，待处理的图片数据有两种存放方式：所有图片在同一目录下，另有一份文本文件记录了标签。不同标签的图片放在不同目录下，文件夹名就是标签。对于这两种情况，我们有不同的解决方法。

使用 Spatial Pyramid Pooling 让 CNN 接受可变尺寸的图像

使用 Spatial Pyramid Pooling 让 CNN 接受可变尺寸的图像

在传统 CNN 中，由于 Fully-Connected 层的存在，输入图像的尺寸受到了严格限制。通常情况下，我们需要对原始图片进行裁剪（crop）或变形（warp）的操作来调整其尺寸使其适配于 CNN。然而裁剪过的图片可能包含不了所需的所有信息，而改变纵横比的变形操作也可能会使关键部分产生非期望的形变。由于图片内容的丢失或失真，模型的准确度会受到很大的影响。

卷积神经网络入门

传统神经网络模型不能很好适应整张2维图片。比如一张 32×32×3(长32-宽32-RGB) 的彩色图片，在传统模型中第一层输入为了读入整张图片就需要 32×32×3 = 3072 个神经元，也就是有 3027 组参数，在这个简单的小图数据集（比如 CIFAR-10）好像看上去还能接受，但是一旦图片变成 200×200 的分辨率，就有 120,000 组参数了，这显然是训练时难以接受的。

爬爬爬 —— BeautifulSoup 还是 Scrapy？

爬爬爬 —— BeautifulSoup 还是 Scrapy？

为什么写这篇短文 1. 最近在做一个 DL×CV 的 proj，需要大量的广东美食图片数据，刚好写一发爬虫。 2. 发现身边很多同学突然看起了 python，而上手 proj 就是写爬虫，然而网上资料纷繁复杂，纠结是用 bs 还是 scrapy。这里的介绍非常简要，涉及深层姿势的部分请出门右拐官网。一些背景姿势在 bs 和 scrapy 之间做选择前，首先当然要了解他们是什么，差别何在。 * Scrapy 是一个非常成熟的工具包，你只要写很少的东西就能达到你要的效果——创建一个 spider 下载网页并提取其中有用的数据。 * BeautifulSoup 则是一个面向网页的工具，它能够解析 DOM 树并提取某些特定的节点（比如 ,

等）。也就是说，只用 bs 是做不了爬虫的，必须要引入 requests 之类的包用来下载网页，

LSTM - 你还记得吗？该忘的就忘了吧。

LSTM - 你还记得吗？该忘的就忘了吧。

一时兴起，来推导一下 LSTM（Long Short Term Memory - 长短期记忆）…… 在处理序列型数据时，我们常常使用循环神经网络（RNN），这正是 LSTM 的前身。

Dropout - 解决神经网络模型过拟合问题的大杀器

Dropout - 解决神经网络模型过拟合问题的大杀器

之前训练了一些深度神经网络模型，几乎都会遇到过拟合的问题，调整过学习率也调整过隐层的层级和数量，但效果依然不尽人意。直到魔改别人代码的时候才发现有个 Dropout，今天来做个小总结。

LSTM 在 Target Dependent Sentiment Analysis 任务中的应用

LSTM 在 Target Dependent Sentiment Analysis 任务中的应用

简述了LSTM在情感倾向分析中的一些应用。

华南理工大学南校区校园网开网教程 for Win

华南理工大学南校区校园网开网教程 for Win

华南理工大学大学城校区互联网办理及安装教程。有什么技术问题请联系软件学院电脑诊所（报单群QQ号：615576434），竭诚为您服务。

Word Embedding

在做NLP的时候，我们处理的features一般都是字词（words），如何表述这些字词便成为了一个非常基础且十分重要的问题。接下来要介绍的是在搭建NLP模型过程中如何用PyTorch这个工具对words进行预处理。

2016电诊出诊 —— 五山便民一条街

2016电诊出诊 —— 五山便民一条街

2016年11月18日上午9时许，“公益进五山，便民一条街”志愿活动在五山花园社区正式启动。电脑诊所和计算机系携手摊位“电脑义诊”，作为先头部队开始架设摊位。