Bỏ qua một số hàng nhất định trong bảng bằng BeautifulSoup
Info Dark
0 comments 109 views

longcv

Posted at March 16, 2022, 5:32 p.m.

0

Tôi muốn kéo toàn bộ bảng thống kê bóng đá giả tưởng NFL 2018 , mã dưới đây có thể thực hiện việc này nhưng tôi gặp phải lỗi này: 'NoneType' object has no attribute 'a'.

Tôi đã phát hiện ra điều này đang xảy ra vì có các hàng lặp lại tên tiêu đề sau mỗi 30 hàng. Các hàng này không chứa thẻ 'a' mà tất cả các hàng khác chứa nhưng chúng là một lớp khác, class = "thead". Tôi đã tìm thấy một vấn đề tương tự từ một vài năm trước nhưng đang gặp sự cố khi điều chỉnh giải pháp cho mã của mình. Sẽ đánh giá cao bất kỳ sự giúp đỡ!

from bs4 import BeautifulSoup

url = 'https://www.pro-football-reference.com'
year = 2018

r = requests.get(url + '/years/' + str(year) + '/fantasy.htm')
soup = BeautifulSoup(r.content, 'html.parser')
parsed_table = soup.find_all('table')[0]
# first 2 rows are col headers so skip them with [2:]
for i,row in enumerate(parsed_table.find_all('tr')[2:]):

print(i)

dat = row.find('td', attrs={'data-stat': 'player'})

name = dat.a.get_text()

stub = dat.a.get('href')



0 answers
Bài đăng liên quan