반응형

DataFrame 3

각 행의 결측/NaN 수 계산

각 행의 결측/NaN 수 계산 행 수가 많은 데이터 세트를 가지고 있습니다.일부 값은 NaN입니다. In [91]: df Out[91]: 1 3 1 1 1 1 3 1 1 1 2 3 1 1 1 1 1 NaN NaN NaN 1 3 1 1 1 1 1 1 1 1 그리고 각 행에 있는 NaN 값의 수를 세고 싶습니다. 다음과 같습니다. In [91]: list = In [92]: list Out[91]: [0, 0, 0, 3, 0, 0] 가장 빠르고 좋은 방법은 무엇입니까?당신은 먼저 원소가 다음과 같은지 찾을 수 있습니다.NaN말든 말든isnull()그 다음엔 행을 따라갑니다.sum(axis=1) In [195]: df.isnull().sum(axis=1) Out[195]: 0 0 1 0 2 0 3 3 4 0 ..

sourcecode 2023.10.30

두 데이터 프레임이 동일한지 확인하는 방법

두 데이터 프레임이 동일한지 확인하는 방법 이 질문에는 이미 다음과 같은 답이 있습니다. R의 행렬 비교 관련 (1개 답변) 닫힘9년 전에. R에 대규모 데이터셋이 있다고 가정해 보겠습니다. 두 데이터셋이 동일한지 여부만 알고 싶습니다.저는 동일한 결과를 얻기 위해 다양한 알고리즘을 실험할 때 자주 사용합니다.예를 들어, 다음과 같은 데이터셋이 있다고 가정해 보겠습니다. df1 all.equal(df1, df3) [1] "Attributes: " [2] "Component 1: Numeric: lengths (5, 6) differ" [3] "Component 2: Lengths: 5, 6" [4] "Component 2..

sourcecode 2023.10.25

결측값이 있는 열의 부분 집합에 대한 행 단위 평균

결측값이 있는 열의 부분 집합에 대한 행 단위 평균 때때로 누락된 값이 있는 'DataFrame'이 있습니다. 다음과 같이 보입니다. Monday Tuesday Wednesday ================================================ Mike 42 NaN 12 Jenna NaN NaN 15 Jon 21 4 1 새로운 것을 추가하고 싶습니다.column제 데이터 프레임에 저장된 데이터를 저장할 수 있습니다.columns모든 일에 대하여row. 그 의미는.Mike, 필요합니다.(df['Monday'] + df['Wednesday'])/2, 대신에Jenna, 저는 단순히.df['Wednesday amt.']/1 결측치로 인한 이 변동을 설명하고 평균을 계산하는 가장 좋은 방법을..

sourcecode 2023.10.10
반응형