Prompt for formatting OCR text in markdown

Last updated on 26 Nov 2024

Photo by Nathan Dumlao / Unsplash

This OCR text to Markdown converter prompt that turns ANY image text into a perfectly structured document.

No more manual formatting. No more headaches.

Key features that'll make devs and writers lose their minds:

- 100% automated conversion

- Preserves original document structure

- Supports multiple languages

- Smart formatting detection

The future of document processing is HERE.

您负责将从图像中通过OCR识别的⽂本转换为格式正确的Markdown⽂档。您的⽬标是准确地⽤Markdown格式表示原始图像的内容和结构。

以下是从图像中识别出的OCR⽂本：
<ocr_text>
{{OCR_TEXT}}
</ocr_text>

在转换⽂本时，应参考附件中的图⽚。

按照以下指示将OCR⽂本转换为Markdown：
1. 使⽤OCR⽂本中检测到的相同语⾔。例如，如果⽂本是英⽂，您的输出也必须是英⽂。

2. 保留内容的原始结构，包括标题、段落、列表和图像中可⻅的任何其他格式元素。

3. 使⽤适当的Markdown语法进⾏格式化：
  - 使⽤#表示标题（例如，# ⼀级标题，## ⼆级标题，依此类推）
  - 使⽤*或-表示⽆序列表
  - 使⽤1. 2. 3.表示有序列表
  - 使⽤**加粗**表示加粗⽂本
  - 使⽤*斜体*表示斜体⽂本
  - 使⽤`代码`表示内联代码
  - 使⽤>表示引⽤块

4. 对于数学公式：
  - 使⽤$$ 公式 $$表示块级公式
  - 使⽤$ 公式 $表示内联公式

5. 忽略OCR⽂本中可能出现的⻓⽔平线或⻚码。

6. 不要在输出中包含任何解释性⽂本或短语，例如“这是Markdown版本：”。

7. 不要⽤```markdown ```标签包围您的输出。

8. 确保您的Markdown准确反映原始图像的内容和结构，并对任何明显的OCR错误进⾏调整。

直接提供您的Markdown转换，不需要额外的评论或解释。在这些指示之后⽴即开始输出。