[ Python ] Cách tạo các ví dụ về gấu trúc có thể tái tạo tốt

Info Dark
0 comments 303 views

thunt

Posted at Jan. 30, 2022, 5:41 a.m.

0

Đã dành một khoảng thời gian kha khá để xem cả hai R programming và Pandas trên SO, ấn tượng mà tôi nhận được là các Pandas câu hỏi ít có khả năng chứa dữ liệu có thể tái tạo. Đây là điều mà cộng đồng R đã khuyến khích khá tốt, và nhờ những hướng dẫn như thế này , những người mới đến có thể nhận được một số trợ giúp trong việc tổng hợp những ví dụ này. Những người có thể đọc các hướng dẫn này và quay lại với dữ liệu có thể tái tạo thường sẽ gặp nhiều may mắn hơn khi nhận được câu trả lời cho câu hỏi của họ.

Làm thế nào chúng ta có thể tạo ra các ví dụ có thể tái tạo tốt cho các Pandascâu hỏi? Các khung dữ liệu đơn giản có thể được ghép lại với nhau, ví dụ:

import pandas as pd

df = pd.DataFrame({'user': ['Bob', 'Jane', 'Alice'],

'income': [40000, 50000, 42000]})

Nhưng nhiều bộ dữ liệu ví dụ cần cấu trúc phức tạp hơn, ví dụ:
+ datetime chỉ số hoặc dữ liệu
+ Nhiều biến phân loại (có tương đương với expand.grid() hàm của R, tạo ra tất cả các kết hợp có thể có của một số biến nhất định không?)
+ Dữ liệu MultiIndex hoặc Panel

Đối với các tập dữ liệu khó giả lập bằng cách sử dụng một vài dòng mã, có mã nào tương đương với R dput() cho phép bạn tạo mã có thể sao chép để tạo lại cơ cấu dữ liệu của mình không?



0 answers