麹町おおいし

pdftotxt仕様メモ_windows_linux

参考サイト

Poppler:pdftotext の使い方

※vertligoサーバを立ち上げてlocalhostからphpたたく
http://localhost/test/test.php

内容は以下の感じ~~~
※Set_time_limitはデフォルト30秒では足りず結構長めにしないと全部のファイルが読めずエラーになったよ

” ;

// ループ処理
while( ($file = readdir($handle)) !== false ) {
$intfilename= str_replace(“.pdf”,””,$file);
$filenameLen=strlen($intfilename)-7;
$intfilename= substr($intfilename,7,$filenameLen);

// ファイルのみ取得
if( filetype( $path = $homeDir . $file ) == “file” ) {

/********************

各ファイルへの処理

$file ファイル名
$path ファイルのパス

// [li]タグ
echo “

  • ” ;

    // ファイル名を出力する
    echo $file ;

    // ファイルのパスを出力する
    echo ” (” . $path . “)” ;

    // [li]タグ
    echo $intfilename ;
    ********************/
    $txtfilename = str_replace(“pdf”,”txt”,$file);
    if ($intfilename%2 == 0 ){
    //$cmd=”pdftotext -x 500 -y 0 -W 500 -H 70 -nopgbrk “.$homeDir.$file.” “.$localDir.$txtfilename;
    echo “偶:” . $txtfilename .”:” . $intfilename . “\n”;
    //$cmd=”pdftotext -x 500 -y 0 -W 500 -H 70 -nopgbrk “.$homeDir.$file.” “.$localDir.$txtfilename;
    $cmd=”pdftotext -nopgbrk “.$homeDir.$file.” “.$localDir.$txtfilename;
    } else {
    echo “奇:” . $txtfilename .”:” . $intfilename . “\n”;
    //$cmd=”pdftotext -x 0 -y 0 -W 500 -H 70 -nopgbrk “.$homeDir.$file.” “.$localDir.$txtfilename;
    $cmd=”pdftotext -nopgbrk “.$homeDir.$file.” “.$localDir.$txtfilename;
    }
    system($cmd,$retVal);

    }
    }

    }
    ?>