[フレーム]
1 - 11 件 / 11件
タグ検索の該当結果が少ないため、タイトル検索結果を表示しています。
はじめに 本記事ではNode.js環境でTypeScriptを用いてPDFテキストを抽出する手順について、プロジェクトのセットアップから扱います。また、型定義を参照しつつサンプルコードに解説を加え、筆者の環境で遭遇したエラーも簡単に取り上げています。 想定読者 PDFをTypeScriptで扱いたい人。 使うもの/環境 2023年3月上旬、下記の環境化での実装です。 OS: Windows 11 VSCode コードの実行はCode Runnerを使用。 Node.js v16.13.2 16系だとエラーが生じます。本文ではそのエラーも扱います。 TypeScript v4.5.5 インストール済であること、文法の知識は前提としています。 pdfjs-dist PDF.jsのnpmライブラリ PDFの操作に使用 サンプルPDF 日本語、テキストのみ。 Marked Contentは対象外。
This post details CVE-2024-4367, a vulnerability in PDF.js found by Codean Labs. PDF.js is a JavaScript-based PDF viewer maintained by Mozilla. This bug allows an attacker to execute arbitrary JavaScript code as soon as a malicious PDF file is opened. This affects all Firefox users (<126) because PDF.js is used by Firefox to show PDF files, but also seriously impacts many web- and Electron-based a
This major release features the new editor mode in the viewer (enabled by default now), new icons in the viewer, removal of deprecated functionality/APIs, removal of support for outdated browser versions, font conversion/text selection improvements and other features/bugfixes. Changes since v2.16.105 Bump versions in pdfjs.config by @timvandermeij in #15357 [api-major] Remove the enhanceTextSelect
PDFファイルを手軽にHTMLに埋め込みたい PDFファイルをHTMLに埋め込む場合、従来だと<iframe>タグを使用するか、pdf.jsを使用する方法、Google Driveのプレビュー用URLを使う方法がありました。 ただし、それぞれ <iframe>タグを使用する方法 → PCのみ埋め込み可、スマホ非対応❌ pdf.jsを使用する方法 → スマホに対応しているが、公式サイトからzipファイルを解凍し自分でサーバーに設置する必要がある(面倒)⚠️ Google Driveのプレビュー用URLを使う方法 → 複数のPDFを埋め込むと挙動が不安定になってしまった&公式でサポートされているものなのか不明❌ という制限がありました。 詳しくはこちらの記事によくまとめられています。 pdf.jsを使うとしても、できることなら<script>タグを一行差し込むだけで使えたら最高です。 pdf.
オランダのセキュリティベンダーCodean Labsは5月20日(現地時間)、「PDF.js」に任意のJavaScriptコードを実行できる脆弱性(CVE-2024-4367)があることを明らかにした。 【画像】実証コード(PoC)が成功した様子 「PDF.js」は、HTML5で構築されたPDFビューワー。「Firefox 19」以降に搭載されている内蔵PDFビューワーなどに用いられている。 PDF形式は複雑なことで有名で、これまでも攻撃のターゲットになってきた。しかし、その多くはC/C++実装のメモリ破壊バグを狙ったものであり、低レベルなメモリアクセスを扱わないJavaScriptで構築された「PDF.js」はそれと無縁に思える。 しかし、Codean Labsによると「PDF.js」でフォントをレンダリングするコードには見落としがあるという。「PDF.js」はパフォーマンスに最適化する
これは何 PDFや画像から一部を切り出してOCRするウェブアプリを作りました。 構成 TypeScript v4.0.5 React.js v17.0.1 (本記事では特に解説しない) tesseract.js v2.1.4 pdfjs-dist v2.5.207 ソースコード 作った経緯 11月の頭頃から、GoToトラベルのアレを利用して安くなってたので飛びついた自動車の免許合宿に行ってたんですが、そこで一緒の部屋で仲良くなった人に「文字がコピペ出来ないPDFがあるんだけど見てほしい」という相談を受けました。 とりあえず見てみると、該当するページは90度回転して記録されており、色々といじくってみたところ「見た目は文字だけどデータ的にはただの図形」という状態になっていることがわかりました。 免許合宿中は正直言ってかなり暇だったので、暇つぶしを兼ねてこれを解決するアプリを作ってみようというこ
ちなみに,なぜFirefoxではPDFのコピペ禁止が作用しないかというと,PDFをHTML5に変換する PDF.js を使ってレンダリングしており,ブラウザ自体は結果のHTML5を表示しているに過ぎないからです。したがって,Chr... https://t.co/dS6P8jQfET
CDNのpdf.jsで日本語を含むPDFファイルを表示させるのに苦戦したのでメモ. Prebuildのzipを展開して設置する場合も多分ほぼ同じ. 検索すると viewer.html を使うやり方はある程度出てくるけれど,pdf.js 自体を読み込んでスクリプトを書く場合の情報は見つけづらい印象. 使用バージョン: pdf.js 2.16.105 公式のExample Examples 最低限.これだけだとCMAPの設定がないので日本語等は表示されない GitHubリポジトリのexamples 色々ある? (あまり見てない) 基本設定 コンソールに Deprecated API usage: No "GlobalWorkerOptions.workerSrc" specified. と表示されるときは と書けばよい.(公式の例にもこの記述がある) 参考: pdfjs-2.13.216-di
「PDFをブラウザで表示する」前回記事の改善がテーマ 前回のブログ(「PDFをダウンロードさせずにブラウザで表示させる」)ではPDF.jsを利用して、ブラウザ上でのPDF閲覧を実現しました。 しかし、その後「文字がぼやけて閲覧しにくい」という問題が発生したので、今回はその対策方法について解説したいと思います。 実装方法1 デフォルトの拡大率を変更する ※(注記)不採用 var viewport = page.getViewport({scale: scale}); この部分のscale のデフォルト値を変更しました。 しかしこれは、表示エリアが拡大し、見やすくはなるかもしれませんが、ぼやけた文字が大きくなるだけで全く見当違いでした。 実装方法2 devicePixelRatio を考慮して描画する ※(注記)保留(あとで登場) var canvas = document.getElementById({P
本記事では、WebブラウザでPDFファイルを表示するためによく使われるオープンソースライブラリの1つ「PDF.js」を使用して、WebページでPDFファイルを表示する方法を紹介します。 PDF.jsを使用してPDFファイルを表示する方法は2つあります。1つ目は<canvas>要素にPDFファイルをレンダリングする方法と、PDF.jsに付属のPDFビューワーを埋め込む方法です。 HTMLのcanvas要素にPDFファイルをレンダリングする方法 ビルド済みのPDF.jsを以下からダウンロードします。2023年3月時点で最新はv3.4.120です。 https://github.com/mozilla/pdf.js/releases pdfjs-hello-worldフォルダを作成して、そこにダウンロードしたpdfjs-3.4.120-dist.zipからbuildフォルダとフォルダ内のファイル
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く