1 用法
Conv2d(in_channels, out_channels, kernel_size, stride=1,padding=0, dilation=1, groups=1,bias=True, padding_mode=‘zeros’)
2 参数
in_channels:输入的通道数目 【必选】
out_channels: 输出的通道数目 【必选】
kernel_size:卷积核的大小,类型为int 或者元组,当卷积是方形的时候,只需要一个整数边长即可,卷积不是方形,要输入一个元组表示 高和宽。【必选】
stride: 卷积每次滑动的步长为多少,默认是 1 【可选】
padding: 设置在所有边界增加 值为 0 的边距的大小(也就是在feature map 外围增加几圈 0 ),例如当 padding =1 的时候,如果原来大小为 3 × 3 ,那么之后的大小为 5 × 5 。即在外围加了一圈 0 。【可选】
dilation:控制卷积核之间的间距(什么玩意?请看例子)【可选】
groups:控制输入和输出之间的连接。(不常用)【可选】
...
Pytorch
未读Pytorch 学习率衰减方法
1.什么是学习率衰减
梯度下降算法需要我们指定一个学习率作为权重更新步幅的控制因子,常用的学习率有0.01、0.001以及0.0001等,学习率越大则权重更新。一般来说,我们希望在训练初期学习率大一些,使得网络收敛迅速,在训练后期学习率小一些,使得网络更好的收敛到最优解。
Pytorch中有两种学习率调整(衰减)方法:
(1)使用库函数进行调整;
(2)手动调整。
2.使用库函数进行调整
Pytorch学习率调整策略通过 torch.optim.lr_sheduler 接口实现。pytorch提供的学习率调整策略分为三大类,分别是:
(1)有序调整:等间隔调整(Step),多间隔调整(MultiStep),指数衰减(Exponential),余弦退火(CosineAnnealing);
(2)自适应调整:依训练状况伺机而变,通过监测某个指标的变化情况(loss、accuracy),当该指标不怎么变化时,就是调整学习率的时机(ReduceLROnPlateau);
(3)自定义调整:通过自定义关于epoch的lambda函数调整学习率(LambdaLR)。 ...
1.安装对应的torch、torchvision
网址:https://pytorch.org/get-started/previous-versions/
搜索对应CUDA版本的安装命令(cu110代表CUDA11.0),在终端中复制命令安装。
查看是否安装成功
123import torchprint(torch.__version__) print(torch.version.cuda)
2.安装torch-geometric
网址:https://pytorch-geometric.com/whl/
找到对应pytorch版本:
四个库(cluster,scatter,sparse,spline-conv)分别:wget 网页中对应的链接并 pip install 下载好的whl包,即完成安装:
注意自己环境的python版本以及linux/win就行
安装完上面四个库后执行 pip install torch-geometric
以上安装完成。
完成之后 import torch-geometric 发现报错,报错信息:“No module named 'torch ...
1 conda虚拟环境
conda常用命令
123conda list # 查看当前虚拟环境已经安装的包(激活虚拟环境后使用)conda env list # 查看当前存在哪些虚拟环境conda update # conda 检查更新当前conda
conda创建虚拟环境
12conda create -n xxx python=3.6# xxx为所创建虚拟环境的名字
conda激活和退出虚拟环境(windows)
123conda activate xx # (虚拟环境名称)conda deactivate
conda为当前虚拟环境安装新的包
1234conda install -n package_name==所需版本 #(版本不指定则默认最新版)# 可使用临时镜像安装加快速度,例如安装numpy:conda install -i https://pypi.tuna.tsinghua.edu.cn/simple numpy
conda删除虚拟环境或者虚拟环境中的某个包
12conda remove -n name --allconda remove --name env_name ...
LaTeX-OCR 是一个开源的光学字符识别(OCR)软件,专为 LaTeX 文档提供支持。其主要目的是帮助用户将扫描的文档转换为 LaTeX 编辑器可以使用的可编辑文本,从而方便进行修改、编辑和排版。
1.安装
LaTeX-OCR可以从源码进行安装,也可以直接用pip来安装,源码地址:https://github.com/lukas-blecher/LaTeX-OCR ,这里直接使用pip安装,为了方便管理环境,使用conda创建虚拟环境。
1234conda create -n latex python=3.10conda activate latexpip install "pix2tex[gui]"pip install "pix2tex[gui]" -i https://pypi.tuna.tsinghua.edu.cn/simple
注:使用pip清华镜像源更快哦~
2.启动与使用
12# 在虚拟环境下执行pix2tex
首次执行会下载依赖模型;
期间可能报错,连接断开,尝试重试;
使用:
输入h 回车查看帮助:
可以看到 ...
git修改remote地址
方式1、直接修改:
1git remote set-url origin xxxxx.git
方式2、先删后加 :
12git remote rm origingit remote add origin xxxxx.git
修改默认pull和push分支:
git branch --set-upstream-to=origin/develop develop
origin/develop develop为要设置的默认分支
给本地和远程仓库重命名
123456789### 1.重命名本地分支git branch -m new-name #如果当前在要重命名的分支git branch -m old-name new-name #如果当前不在要重命名的分支### 2.删除远程旧名称分支并且push新名称分支git push origin :old-name new-name### 3.关联新名称的本地分支和远程分支 git push origin -u new-name123456789
修改远程仓库地址
1git remote set-url origin ...
Tools
未读PDFMathTranslate
PDF科学论文翻译和双语比较。
📊 保留公式、图表、目录和注释(预览)。
🌐 支持多种语言和多样化的翻译服务。
🤖 提供命令行工具、交互式用户界面和Docker镜像。
python环境下安装
Python installed (3.8 <= version <= 3.12)
Install our package:
1pip install pdf2zh
Execute translation, files generated in current working directory:
1pdf2zh document.pdf
docker安装(推荐)
Pull and run:
12docker pull byaidu/pdf2zhdocker run -d -p 7860:7860 byaidu/pdf2zh
Open in browser:
1http://localhost:7860/
附:
Option
Function
Example
files
Local files
pdf ...
解决“无法加载文件 ***\WindowsPowerShell\profile.ps1,因为在此系统上禁止运行脚本”
在VScode使用anaconda时,提示
12. : 无法加载文件 C:\Users\47370\Documents\WindowsPowerShell\profile.ps1,因为在此系统上禁止运行脚本。有关详细信息,请参阅 https:/go.microsoft.com/fwlink/?LinkID=135170 中的 about_Execution_Policies。
想了解计算机上的现用执行策略,打开 PowerShell 然后输入:
12>> get-executionpolicyRestricted
更改执行策略,以管理员身份打开 PowerShell 输入:
1>> set-executionpolicy remotesigned
选择“是”,即可。
如果要更改回Windows 客户端计算机的默认执行策略,则设置为restricted:
1set-executionpolicy restricted
Deep Learning
未读和大部分人一样,我对自然语言处理和语言模型的了解从ChatGPT开始。也和大部分人一样,第一次接触就被ChatGPT的能力所震惊 —— 硅基智能确实做到了理解人类的语言。
我也产生了几乎人人都会有的疑问:怎么做到的?硅基智能潜力是否会远胜于碳基智能?
在这篇文章中,我并不试图去解释ChatGPT的一切,而是将从原理出发,思考计算机理解语言的关键要素,这些思考落到了一个具体的切入点 —— embedding —— 一个第一眼难以理解但极为关键的东西。
文章是一个门外汉通过业余的研究和碎片的思考所完成,谬误之处难以避免,欢迎专业的研究人员指正。
1 编码:文字的数字化
Embedding 这个词直译为中文是:嵌入,这是让人头秃的两个字 —— 啥是嵌入?嵌入了啥?跟自然语言又有啥关系?
嵌入的体现形式是一组具有固定长度的数组,或者叫做向量,但它究竟是什么?为什么需要它?它在计算机理解自然语言的过程中扮演的是怎样的角色呢?
要回答这些问题,不妨先思考:让计算机理解自然语言,我们需要做什么?
计算的基础是数,而自然语言是文字,因此很容易想到要做的第一步是让文字数字化,为行文方便,我们将这个过程叫 ...
Deep Learning
未读(Latent Space)理解深度学习中的潜在空间
什么是潜在空间?
If I have to describe latent space in one sentence, it simply means a representation of compressed data.
[!NOTE]
想象一个大的手写数字数据集(0–9),就像上面显示的那样。 与其他不同编号(即3s与7s)的图像相比,相同编号的手写图像(即3的图像)彼此最相似。 但是我们可以训练一种算法来识别这些相似之处吗? 如何进行?如果您已经训练了一个模型来对数字进行分类,那么您也已经训练了该模型来学习图像之间的“结构相似性”。 实际上,这就是模型能够通过学习每个数字的特征而首先对数字进行分类的方式。这个过程似乎对您“隐藏”了,那根据定义,潜在性即是指“隐藏”。
“潜在空间”的概念很重要,因为它的用途是“深度学习”的核心-学习数据的特征并简化数据表示形式以寻找模式。
其实,Latent Variable这个概念在统计机器学习中并不陌生,概率图模型里从GMM (高斯混合模型), HMM(隐马尔科夫模型), 到PP ...