0. groupby 메서드 - 데이터를 그룹 별로 분류하는 역할 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 import pandas as pd import numpy as np np.random.seed(0) df = pd.DataFrame({ 'key1': ['A', 'A', 'B', 'B', 'A'], 'key2': ['one', 'two', 'one', 'two', 'one'], 'data1': [1, 2, 3, 4, 5], 'data2': [10, 20,..
0. python from itertools import product - 길이 3이니깐 3^2 = 9 - 길이는 9개 - 두개 이상의 리스트에서 모든 조합을 구하는 방법 1 2 3 4 5 6 7 from itertools import product example = [['x'],['a','b',],['1','2','3']] result = list(product(example, example)) len_result = len(result) print(result) #[(['x'], ['x']), (['x'], ['a', 'b']), (['x'], ['1', '2', '3']), (['a', 'b'], ['x']), (['a', 'b'], ['a', 'b']), (['a', 'b'], ['1', '2',..
1. set - 반복가능하고, 가변적이다 - 중복 요소가 없고 정렬되지 않은 컬렉션 데이터 타입이다. - 인덱스 연산은 할 수 없다 - 멤버십 테스트 및 중복 항목 제거에 이용된다. - w집합과 관련된 자료형 1 2 3 4 5 6 7 8 9 10 #집합 자료형 s = {3,5,7} print(s) print(type(s)) """ {3, 5, 7} """ cs 1.1 set 메서드 - intersection(), union(), difference() 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 a = {1,2,3,4,5} b = {2,3,4} #교집합 intersec = a.intersection(b) print(intersec) #{2, 3, 4} #합집합 uni = a.union..
1. if 문 1 2 3 4 5 6 7 8 9 10 x = int(input("숫자를 입력하세요")) if x> return 키워드는 반환값을 반환하고 메서드를 종료한 후, 호출자에게 제어를 반환 >> yield 키워드는 각 반환값을 호출자에게 반환하고, 반환값이 모두 소진되었을 때에만 메서드가 종료 - yield 키워드는 제너레이터 맥락에서 이터레이터를 만드는 아주 강력한 도구 - 제너레이터는 최종값을 반환하지만, 이터레이터는 yield 키워드를 사용하여 코드 실행중에 값을 반환한다. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 def fib_generator(): a,b = 0,1 while True: yield b a,b = b, a+b if __name__ ==..
1. label encoding - 단순하게 레이블링 해주는 것 - 하지만 머신러닝시 가중치로 되어 데이터 정확도에 혼선을 줄 수 있음 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 from sklearn.preprocessing import LabelEncoder import pandas as pd import numpy as np array = np.array([["paris","paris","seoul"],["newyork","paris","seoul"],["seoul","paris","paris"],["seoul","paris","paris"]]) df = pd.DataFrame(array, columns = ['A','B','C']) ..
0 . Predict Future Sales - 캐글 링크 불러오는 중입니다... 1. Data Description - 일일 이력 판매 데이터가 제공됩니다. 작업은 테스트 세트에 대해 모든 상점에서 판매 된 총 제품 수를 예측하는 것입니다. 상점 및 제품 목록은 매달 약간 씩 변경됩니다. 이러한 상황을 처리 할 수있는 강력한 모델을 만드는 것은 어려운 일 중 하나입니다. sales_train.csv - the training set. Daily historical data from January 2013 to October 2015. test.csv - the test set. You need to forecast the sales for these shops and products for Novemb..
1. 멀티 프로레스와 멀티 스레드 - 프로세스(process) : 운영 체제에서 실행되는 각 프로그램은 각각이 벼도의 프로세스 - 각 프로세스에는 하나 이상의 스레드(thread)가 있음 - 한 프로세스에 여러개의 스레드가 있으면 여러 작업을 마치 동시에 수행하는것처럼 보임. - 멀티 프로레스와 멀티 스레드 두가지 방법 사용시 프로그램의 작업 부하를 줄일 수 있음. * 멀티 프로세스 - 별도의 메모리 영역을 가지며, 특별한 메커니즘으로만 통신할 수 있음 - 프로세서는 각 스레드에 대해 별도의 레지스터 집합을 불러오거나 저장하는데, 프로세스 간 데이터 공유와 통신용으로는 비효율적 - subprocess 모듈 사용 * 멀티 스레드 - 단일 프로세스 내의 멀티 스레드는 동일한 메모리에 접근 - 스레드는 데이터..
0. 블록체인이란? - 관리 대상 데이터를 '블록'이라고 하는 소규모 데이터들이 P2P 방식을 기반으로 생성된 체인 형태의 연결고리 기반 분산 데이터 저장환경에 저장되어 누구라도 임의로 수정할 수 없고 누구나 변경의 결과를 열람할 수 있는 분산 컴퓨팅 기술 기반의 원장 관리 기술 - 데이터 분산 처리 기술, 암호학적으로 안전한 블록들의 체인 - 중앙에서 데이터를 처리하거나 관리하는 기관이 없음 - 모든 사용자가 데이터 내역을 가짐 1. 블록체인 비대칭키 암호화 방식 - 비트코인에서 거래가 안전하게 이루어질 수 있도록 사용하는 암호화 기술 1.1 암호화 기술 * 대칭키 암호화 - 키가 하나 - 암호화를 할 떄와 암호를 풀 때 동일한 키를 사용한다 * 비대칭키 암호화 - 암호화할 때 사용하는 키와 암호를 풀..
0. hashlib - 1. 예제 1 2 3 4 5 6 7 import json import hashlib block = {'index': 1, 'timestamp': 1570176533.2550528, 'transactions': [], 'proof': 100, 'previous_hash ': '1'} block_string = json.dumps(block,sort_keys = True).encode() print(hashlib.sha256(block_string).hexdigest()) Colored by Color Scripter cs >> d9360c4ec2b62490970a360964e32f21299c52c29be7e9f46d1787af7cc31c82
1. partial 함수 - 함수를 만들어 넘길때 자주 사용 1 2 3 4 5 6 7 8 from functools import partial def sum(a,b): print(a+b) f = partial(sum,20) f(1) >>21 cs 2. lambda 함수 - lambda expression - 함수를 간편하게 작성할 수 있어서 다른 함수의 인수로 넣을때 주로 사용 - 매개변수, 연산자, 값 등을 조합한 식으로 반환값을 만드는 방식 1 2 3 sum_ex = lambda x : x + 20 sum_ex(2) cs 1. 파이썬코딩도장 2. 위키독스