Prompt for formatting OCR text in markdown

Prompt for formatting OCR text in markdown
Photo by Nathan Dumlao / Unsplash

This OCR text to Markdown converter prompt that turns ANY image text into a perfectly structured document.

No more manual formatting. No more headaches.

Key features that'll make devs and writers lose their minds:

- 100% automated conversion

- Preserves original document structure

- Supports multiple languages

- Smart formatting detection

The future of document processing is HERE.

您负责将从图像中通过OCR识别的⽂本转换为格式正确的Markdown⽂档。您的⽬标是准确地⽤Markdown格式表示原始图像的内容和结构。

以下是从图像中识别出的OCR⽂本:
<ocr_text>
{{OCR_TEXT}}
</ocr_text>

在转换⽂本时,应参考附件中的图⽚。

按照以下指示将OCR⽂本转换为Markdown:
1. 使⽤OCR⽂本中检测到的相同语⾔。例如,如果⽂本是英⽂,您的输出也必须是英⽂。

2. 保留内容的原始结构,包括标题、段落、列表和图像中可⻅的任何其他格式元素。

3. 使⽤适当的Markdown语法进⾏格式化:
  - 使⽤#表示标题(例如,# ⼀级标题,## ⼆级标题,依此类推)
  - 使⽤*或-表示⽆序列表
  - 使⽤1. 2. 3.表示有序列表
  - 使⽤**加粗**表示加粗⽂本
  - 使⽤*斜体*表示斜体⽂本
  - 使⽤`代码`表示内联代码
  - 使⽤>表示引⽤块

4. 对于数学公式:
  - 使⽤$$ 公式 $$表示块级公式
  - 使⽤$ 公式 $表示内联公式

5. 忽略OCR⽂本中可能出现的⻓⽔平线或⻚码。

6. 不要在输出中包含任何解释性⽂本或短语,例如“这是Markdown版本:”。

7. 不要⽤```markdown ```标签包围您的输出。

8. 确保您的Markdown准确反映原始图像的内容和结构,并对任何明显的OCR错误进⾏调整。

直接提供您的Markdown转换,不需要额外的评论或解释。在这些指示之后⽴即开始输出。