【Python3】Beautiful Soupについての質問 – python

質問:


Beautiful Soupで

<div class="hoge1">
 <div class="hoge2">
  <p>hogehoge</p>
 </div>
</div>

といったHTMLコードから<p>の部分を取得するにはどのようにしたら良いのでしょうか?
 

質問者: creamroid

下記ではいかがでしょうか。

from bs4 import BeautifulSoup
html = """
    <div class="hoge1">
     <div class="hoge2">
      <p>hogehoge1</p>
      <p>hogehoge2</p>
     </div>
    </div>
"""
soup = BeautifulSoup(html, "lxml")
text1 = soup.find_all("p")  # htmlからpのタグを取得 配列で出力
text2 = text1[0].string  # 取得した配列データからタグの文字列を取得
text3 = text1[1].string  # 取得した配列データからタグの文字列を取得

print(text1)
print(text2)
print(text3)

>> > [ < p > hogehoge1 < /p > , < p > hogehoge2 < /p > ]
>> > hogehoge1
>> > hogehoge2

出典

Related Posts:

NameErrorが出る – python
質問: 以下のコードを実行したいのですがエラーが出てしまいます。 解決方法を教えていただけると幸いです。 元のコードはdata-science-from-scratch/nearest_neighbors.pyにあります。 現在Pythonを学び始めたばかりなのですが、したいこととしてはk近傍方でk=1,3,5,7でどのような結果になるのか示したいと認識しています。 import math def knn_classify(k, labeled_points, new_point): """each labeled point should be a pair (point, label)""" # order the labeled ...
tensor flowのバージョンアップを行った結果、checkpointファイルのフォーマットが変更されている – python tensorflow
質問: tensorflowの学習モデルの出力フォーマットが以前のものとは変更されており、 model.ckptだけであったのが model.ckpt-1111.data-00000-of-000001, model.ckpt-1111.index, model.ckpt-1111.meta といった具合に3ファイルに変更されており対処に困っています。 どのckptファイルを参照するのか、またコード例が知りたいです。 ~~~下記は自分が使っているコードの一部です~~~ images_placeholder = tf.placeholder("float", shape=(None, IMG_PIXELS)) keep_prob = tf.placeholder("float") logits = inference(images_placeholder, keep_prob) sess = tf.InteractiveSession() saver = tf.train.Saver() sess.run(tf.global_variables_initializer()) saver.restore(sess, "model.ckpt") 質問者: nyannyan tensorflow r12よりcheckpointファイルのフォーマットが変更されております。 とりあえず過去フォーマットでsaveしたいのならば import tensorflow as tf from ...
jsonのtrueをTrueにしたい [クローズ済み] – python
質問: json = {"Hi":true} このHiのtrueをTrueにして論理演算できるようにしたいです。 質問者: たかなし json.dumps を使ってPythonのオブジェクトに変換できます。 >>> import json >>> d = json.loads('{"Hi":true}') >>> d {'Hi': True} 出典
tkinter の bad geometry specifier “200*100” というエラーの意味がよくわからない – python python3 tkinter
質問: このプログラムを実行しようとすると というメッセージが表示されます。 何が悪いのかよくわからないので一度Pythonをアンインストールして最新のPythonを再インストールしたのですが結果は変わりませんでした。 インストールする前のPathのチェック欄にはチェックを入れました。 すごく初歩的なことで恐縮ですが、お願いします。 質問者: 岸本真人 Kohei TAMURA 200*100ではなく、200x100ではないですかね。 tkinter の使い方は独特な所があり、色々とつまずくかも知れません。 使い方が解らないメソッドなどは help 関数などで説明を読むことができます。今回ですと、Pythonコード内で help(root.geometry) とすると、 Help on method wm_geometry in module tkinter: wm_geometry(newGeometry=None) method of ...
pythonからツイートの保存について – python twitter
質問: 下記のツイートを保存したいのですが上手くいきません。実行中でpython intento.py >> result.dat を書きました。 #-*- coding: utf-8 -*- from tweepy.streaming import StreamListener from tweepy import OAuthHandler from tweepy import Stream import json # Variables that contains the user credentials to ...
pythonパラメータエラーに関して(スクレイピング) – python
質問: いつもお世話になっております。 再度みなさまの知見をお借りしたく質問させていただきます。 ただいま、pyrhonでスクレイピングに挑戦をしていました。 実践しようとしているのはJRAのページの馬柱をスクレイピングしようとしていました。 url ='http://www.jra.go.jp/JRADB/accessD.html' fetched_dataframes = pandas.io.html.read_html(url) ...
異なるwebページからの情報取得を一本化したい – python
質問: 現在、Pythonを学習しています。 Google検索APIで「東京都 会社概要」と検索し、検索結果の各webページのURLを取得し、 それらのURL先をスクレイピングして会社概要を取得しようと考えています。 当たり前のことですが、各webページのhtmlの書き方が異なっていて、tableタグだったり、liタグだったりで上手く求めている情報を抽出できません。 何かアイデアがあれば教えて頂きたいです。 # コード1.googleAPI検索し、結果をjsonファイルに出力 import json import urllib.request import urllib.parse from urllib.request import urlopen QUERY = u'会社概要+東京都' key = 'KEY' cx = 'CX' NUM = 3 cseurl = 'https://www.googleapis.com/customsearch/v1?' params = ...
tensor flow をjupyter notebookで使っているんですがtensor boardが使えません。 – python tensorflow
質問: 初心者です。 tensor flow をjupyter notebookで使っているんですがtensor boardが使えません。 下記のプログラムをjupyter notebook上で打ち込んでtensorboad --logdir=/path/to/log をターミナルで打ち込みましたがうまくいきません。 教えてもらえると有難いです。 import tensorflow as tf import numpy as np import os LOG_DIR = os.path.join(os.path.dirname("__file__"), 'log') if os.path.exists(LOG_DIR) is False: os.mkdir(LOG_DIR) w ...
サイトが表示されません。 – python linux ubuntu
質問: https://github.com/blobmon/simplechan 上の掲示板をネット上に設置したのですが、ホーム画面は表示されるのですが、そこからクリックをして入ったら本来表示されるべきものが表示されません。クリックしたらこんなものが出てきます。 psycopg2.OperationalError OperationalError: FATAL: Peer authentication failed for user "simplech_role" Traceback (most recent call last) File "/root/simplechan/venv/lib/python2.7/site-packages/flask/app.py", line 2309, in __call__ return self.wsgi_app(environ, start_response) File "/root/simplechan/venv/lib/python2.7/site-packages/flask/app.py", line 2295, in ...
指定した通りに配列の要素を書き換えたい – python アルゴリズム
質問: 二次元配列の要素を、別の配列のデータに従って入れ替えたいです。 今、1つの配列に縦5横6の二次元配列があり、配列(array)の中身は全て "." で埋まっています。つまりarrayは array = [ , , , , # ←① ] となっています。 この "." を str_array 配列の数字に従って書き換えたいです。たとえば str_array が str_array ...
python3のエラー “TypeError: Tensors … that don’t all match” がわからない – python python3 tensorflow
質問: Traceback (most recent call last): File "/Users/oshikawaakinobu/anaconda3/lib/python3.6/site-packages/tensorflow/python/framework/op_def_library.py", line 458, in _apply_op_helper raise TypeError() # All types should match. TypeError During handling ...
pip installコマンドでCould not open requirements file: [Errno 2] No such file or directory:というエラーが出る – python
質問: Colaというプログラムを使って、Weiboの投稿を取得したいです。pip install colaまではうまくいきますが 下記のコマンドを打つとエラーが表示されます。 エラーがなぜ起きるかわかる方がいれば教えてください。 # pip install -r/path/to/cola/app/weibo/requirements.txt Could not open requirements file: No such file or directory: '/path/to/cola/app/weibo/requirements.txt' 質問者: ...
ループ終了後に、結果を最後にまとめて取得したい – python
質問: 質問内容が分かりづらかったので、コードや欲しい結果を具体的に書きます ・再帰と勘違いしていたので、タイトルも変更しました 最終的にやりたいこと ・このリンク先にあるコード結果を、Bottleを使用してWeb画面上に表示したい 試したこと from urllib.request import urlopen from bs4 import BeautifulSoup import datetime import random import re from bottle import route, view random.seed(datetime.datetime.now()) def getLinks(articleUrl): html = urlopen("http://en.wikipedia.org"+articleUrl) ...
pyenvを使ってpythonをインストールしようとしているのですが。。。 – python
質問: pyenvを使ってMacにPythonの環境を構築する - Qiita このサイトに従ってpyenvを使ってpythonをインストールしようとしているのですがうまくいきません。 OSはmacの10.10.1です。 上記のサイトで言う所のpyenvにパスを通す、というところまではできたのですが、 その次のpyenvでpythonをインストールすることができません。 SSL/TLSが必要と出てきたのでぐぐってみたのですがいまいちよくわかりません。 どうすれば先に進めるでしょうか よろしくお願いします。 質問者: Kazutoshi Shinoda 3100 このあたりが参考になりそう。きっと良くなります。 pyenv のインストールメモ #python #mavericks - jitsu102's blog 出典
TypeError: predict() got an unexpected keyword argument ‘k’ – CIFAR-10を使ったknnでエラー, Python2.7.12 – python
質問: 以下のリンクにあるCIFAR-10(ラベル付されたサイズが32x32のカラー画像8000万枚のデータセット)を読み取り、knnによりクラス分けしその精度を%で出力させたいのですが以下のエラー出てしまいました。問題は86行目のkにあるようですが解決方法がみつからず、何かアドバイス頂けると幸いです。 以下コード; import pickle import numpy as np import os def unpickle(file): fo = open(file, 'rb') dict = pickle.load(fo) fo.close() ...

You Might Also Like

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です