티스토리 뷰
0. groupby 메서드
- 데이터를 그룹 별로 분류하는 역할
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
|
import pandas as pd
import numpy as np
np.random.seed(0)
df = pd.DataFrame({
'key1': ['A', 'A', 'B', 'B', 'A'],
'key2': ['one', 'two', 'one', 'two', 'one'],
'data1': [1, 2, 3, 4, 5],
'data2': [10, 20, 30, 40, 50]
})
print(df)
"""
key1 key2 data1 data2
0 A one 1 10
1 A two 2 20
2 B one 3 30
3 B two 4 40
4 A one 5 50
"""
# key1을 기준
groups = df.groupby(df.key1)
#속성
print(groups.groups)
"""
{'A': Int64Index([0, 1, 4], dtype='int64'), 'B': Int64Index([2, 3], dtype='int64')}
"""
#data1에서만 그룹연산 하는 코드
print(df.data1.groupby(df.key1).sum())
"""
key1
A 8
B 7
Name: data1, dtype: int64
"""
print(df.groupby(df.key1)["data1"].sum())
"""
key1
A 8
B 7
Name: data1, dtype: int64
"""
print(df.groupby(df.key2).sum()["data2"] )
"""
key2
one 90
two 60
Name: data2, dtype: int64
"""
|
cs |
<출처>
1. 데이터 사이언스 스쿨
'Programming > python' 카테고리의 다른 글
[flask-bootstrap] 화면 띄우기 (0) | 2020.06.04 |
---|---|
파이썬 - 파이썬을 파이썬답게 (0) | 2020.04.09 |
python from itertools import product (0) | 2019.10.07 |
python 멀티 프로세스와 멀티 스레드 (0) | 2019.10.05 |
python hashlib (0) | 2019.10.04 |
댓글