banner
lca

lca

真正的不自由,是在自己的心中设下牢笼。

ウィンドウズ上でマーカーをインストールする

以下是将文本翻译成日语的结果:

プロジェクトのアドレス:https://github.com/VikParuchuri/marker

公式の説明によれば、Marker は PDF、EPUB、および MOBI を markdown ドキュメントに変換し、nougat よりも 10 倍高速です。

公式では Linux と Mac のインストール方法のみ提供されていますが、参考によれば Windows でもインストールできます。

以下はインストール手順です:

  1. Visual Studio 2022 をインストールします。
  2. NVIDIA CUDAをインストールします。
  3. PyTorch をインストールします。
pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121
  1. wheel をインストールします。
pip install wheel
  1. detectron2 をインストールします。ローカルでのインストールが必要です。エラーの場合は#issuecomment-651560907を参照してください。

手順は以下の通りです:

git clone https://github.com/facebookresearch/detectron2.git
cd detectron2/

# 管理者権限でコマンドプロンプトを実行します
python setup.py install

detectron2\layers\csrc\nms_rotated\nms_rotated_cuda.cuファイルの内容を以下の内容に変更します。

// Copyright (c) Facebook, Inc. and its affiliates.
#include <ATen/ATen.h>
#include <ATen/cuda/CUDAContext.h>
#include <c10/cuda/CUDAGuard.h>
#include <ATen/cuda/CUDAApplyUtils.cuh>
/*#ifdef WITH_CUDA
#include "../box_iou_rotated/box_iou_rotated_utils.h"
#endif
// TODO avoid this when pytorch supports "same directory" hipification
#ifdef WITH_HIP
#include "box_iou_rotated/box_iou_rotated_utils.h"
#endif*/
#include "box_iou_rotated/box_iou_rotated_utils.h"

変更後、以下のコマンドを実行します。

python setup.py install
  1. Tesseract と Ghostscript の Windows バージョンをインストールします。

Tesseract:

tesseract-ocr-w64-setup-5.3.3.20231005.exe

Ghostscript:

gs10021w64.exe

  1. VikParuchuri/marker をインストールします。
git clone https://github.com/VikParuchuri/marker.git

VikParuchuri/marker/requirements.txt から detectron2 を削除し、上記の手順で手動でインストールします(つまり、5 番目の手順を実行している場合は、このステップをスキップして detectron2 の依存関係を削除します)。

他の依存関係がインストールされていない場合は、以下を実行します。

pip install -r requirements.txt
pip install ftfy
pip install spellchecker
pip install pyspellchecker
pip install ocrmypdf
pip install nltk
pip install thefuzz
pip uninstall python-magic
pip install python-magic-bin
pip install ray==2.7.1
  1. nougat をインストールします。
# 以下の方法ではエラーが発生します
pip install nougat-ocr

# この方法でインストールします
pip install git+https://github.com/facebookresearch/nougat

python convert_single.py "Vim 101 Hacks.pdf" vim.md --parallel_factor 5を実行するとエラーが発生します。

  1. エラーメッセージは以下の通りです。
python convert_single.py "Vim 101 Hacks.pdf" vim.md --parallel_factor 5
Special tokens have been added in the vocabulary, make sure the associated word embeddings are fine-tuned or trained.
C:\Users\lca\AppData\Roaming\Python\Python311\site-packages\torch\functional.py:504: UserWarning: torch.meshgrid: in an upcoming release, it will be required to pass the indexing argument. (Triggered internally at ..\aten\src\ATen\native\TensorShape.cpp:3527.)
  return _VF.meshgrid(tensors, **kwargs)  # type: ignore[attr-defined]

このエラーメッセージを処理するには、C:\Users\lca\AppData\Roaming\Python\Python311\site-packages\torch\functional.pyファイルを見つけて、return _VF.meshgrid(tensors, **kwargs)return _VF.meshgrid(tensors, **kwargs, indexing = 'ij')に変更します。

参考:marker
参考:issues

読み込み中...
文章は、創作者によって署名され、ブロックチェーンに安全に保存されています。