牛!这个工具能将公式图片转化为 LaTeX 格式

开发 开发工具
image-to-latex 是一个能将 LaTeX 数学方程的图像映射到 LaTeX 代码的应用程序。

  [[420928]]

简介

image-to-latex 是一个能将 LaTeX 数学方程的图像映射到 LaTeX 代码的应用程序。

Yuntian Deng 等人在 2016 年提出并尝试了 image-to-markup 的问题。他们通过解析来自 arXiv 的 LaTeX 论文来源,提取了大约 10 万个公式。他们使用 pdflatex 渲染公式并将渲染的 PDF 文件转换为 PNG 格式。在他们的模型中,首先使用 CNN 来提取图像特征。然后使用 RNN 对特征行进行编码。

最后,编码特征由 RNN 解码器使用。该模型共有 948 万个参数。最近,Transformer 在很多语言任务上都超过了 RNN,所以作者在这个问题上进行了新的尝试。

项目地址:

https://github.com/kingyiusuen/image-to-latex

下载安装

安装

将源代码 clone 到本地文件夹:

  1. git clone https://github.com/kingyiusuen/image-to-latex.git 
  2.  
  3. cd image-to-latex 

创建名称为 venv 的虚拟环境,并安装所需的包:

  1. make venv 
  2.  
  3. make install-dev 

数据预处理

运行以下命令下载 im2latex 数据集并进行所有预处理,图像裁剪步骤可能需要一个多小时。

  1. python scripts/prepare_data.py 

部署

创建 API 以使用经过训练的模型进行预测。使用以下命令启动并运行服务器:

  1. make api 

可以通过 http://0.0.0.0:8000/docs 上生成的文档查看 API 的使用方法。

模型架构

运行例子

 

 

责任编辑:张燕妮 来源: 开源前哨
相关推荐

2019-12-02 10:32:58

开发技能代码

2023-04-12 16:43:40

2018-06-12 15:07:57

IT

2018-06-20 09:09:09

数据存储信息

2020-08-17 12:54:51

代码开发工具

2021-08-26 10:29:47

工具Root框架

2019-04-08 08:25:48

代码开发工具

2020-09-08 10:08:45

分析

2022-08-27 15:27:34

LinuxdockerCompose

2017-12-27 08:13:27

2017-11-03 17:05:11

开源

2013-11-29 10:08:19

SDN大数据

2019-07-12 12:50:31

数据科学数据转化分析

2023-03-28 15:06:47

人工智能聊天机器人

2009-08-04 17:34:27

Erlang的Acto

2021-04-18 18:42:39

机器学习数据可操作见解

2023-10-06 13:22:50

自动驾驶技术

2013-06-18 10:13:46

大数据量化数据数据价值

2009-09-04 13:37:44

C#货币格式

2018-05-05 14:53:11

大数据价值项目
点赞
收藏

51CTO技术栈公众号