티스토리 뷰

Programming/python

python - pandas [3] groupby

RosyPark 2019. 10. 7. 23:12

0. groupby 메서드

- 데이터를 그룹 별로 분류하는 역할

 

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
import pandas as pd
import numpy as np
np.random.seed(0)
df = pd.DataFrame({
    'key1': ['A''A''B''B''A'],
    'key2': ['one''two''one''two''one'],
    'data1': [12345],
    'data2': [1020304050]
})
 
print(df)
"""
  key1 key2  data1  data2
0    A  one      1     10
1    A  two      2     20
2    B  one      3     30
3    B  two      4     40
4    A  one      5     50
"""
 
# key1을 기준
groups = df.groupby(df.key1)
 
#속성
print(groups.groups)
"""
{'A': Int64Index([0, 1, 4], dtype='int64'), 'B': Int64Index([2, 3], dtype='int64')}
"""
 
#data1에서만 그룹연산 하는 코드
print(df.data1.groupby(df.key1).sum())
"""
key1
A    8
B    7
Name: data1, dtype: int64
"""
 
print(df.groupby(df.key1)["data1"].sum())
"""
key1
A    8
B    7
Name: data1, dtype: int64
"""
 
print(df.groupby(df.key2).sum()["data2"] )
"""
key2
one    90
two    60
Name: data2, dtype: int64
"""
 
 
 
 
cs

 

 

<출처> 

1. 데이터 사이언스 스쿨 

'Programming > python' 카테고리의 다른 글

[flask-bootstrap] 화면 띄우기  (0) 2020.06.04
파이썬 - 파이썬을 파이썬답게  (0) 2020.04.09
python from itertools import product  (0) 2019.10.07
python 멀티 프로세스와 멀티 스레드  (0) 2019.10.05
python hashlib  (0) 2019.10.04
댓글
공지사항
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
링크
TAG more
«   2024/05   »
1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30 31
글 보관함