Latex OCR

LaTeX-OCR 是一个开源的光学字符识别(OCR)软件,专为 LaTeX 文档提供支持。其主要目的是帮助用户将扫描的文档转换为 LaTeX 编辑器可以使用的可编辑文本,从而方便进行修改、编辑和排版。

image-20231219121553484

1.安装

LaTeX-OCR可以从源码进行安装,也可以直接用pip来安装,源码地址:https://github.com/lukas-blecher/LaTeX-OCR ,这里直接使用pip安装,为了方便管理环境,使用conda创建虚拟环境。

1
2
3
4
conda create -n latex python=3.10
conda activate latex
pip install "pix2tex[gui]"
pip install "pix2tex[gui]" -i https://pypi.tuna.tsinghua.edu.cn/simple

注:使用pip清华镜像源更快哦~

2.启动与使用

1
2
# 在虚拟环境下执行
pix2tex

首次执行会下载依赖模型;

image-20231219000535903

期间可能报错,连接断开,尝试重试;

使用:

image-20231219000831872

输入h 回车查看帮助:

image-20231219000913782

可以看到windows或macos下可以非常丝滑地使用,只需要:

  • 截图或复制一个图片到memory,可以理解为复制到剪贴板;
  • 回到终端按回车,即可看到公式:image-20231219001159694
  • 复制内容到LaTex块即可;

mini=1nL(f(Gi,YiVi))m i n\sum_{i=1}^{n}{\mathcal{L}}(f(G_{i},Y_{i}|V_{i}))

Ωj=tanh(Wh(rjΩS)+[hej+bh)\Omega_{j}=tanh({\bf W}_{h}\left({\bf r}_{j}\odot\Omega_{S}\right)+\left[\nabla_{h}\mathrm{e}_{j}+\mathrm{b}_{h}\right)

工具很好用,无限制,非常良心,简直是福祉。