You can use httplib library to download the html and then for extracting the text from it either you can use any library (google for it) or you can use regular expression for it .
AltStyle によって変換されたページ (->オリジナル) / アドレス: モード: デフォルト 音声ブラウザ ルビ付き 配色反転 文字拡大 モバイル