본문 바로가기

기본소양49

2. Statistics [4] CODE 0. 데이터 셋 만들기 # 패키지설치 !sudo apt-get install -y fonts-nanum !sudo fc-cache -fv !rm ~/.cache/matplotlib -rf !pip3 install numpy !pip3 install pandas import pandas as pd import numpy as np import io import seaborn as sns import matplotlib.pyplot as plt import matplotlib as mpl import warnings plt.rc('font', family='NanumBarunGothic') mpl.rc('axes', unicode_minus=False) warnin.. 2021. 1. 10.
[WEB] CSS Box Model 보호되어 있는 글 입니다. 2021. 1. 9.
[ 통계, 처음입니다 ] 베이지안이론 (Bayesian Theory) 추론의 방법 통계적 추론(statistical inference) 또는 통계적 추측은 모집단에 대한 어떤 미지의 양상을 알기 위해 통계학을 이용하여 추측하는 과정을 지칭한다. 통계학의 한 부분으로서 추론 통계학이라고 불린다. 추론 통계에는 도수 확률(frequency probability)과 사전 확률(prior probability)을 기반으로 하는베이즈 추론의 두 학파가 있다. - wikipedia 어떠한 모집단의 특성을 알고싶을 때는 그 집단을 조사하야합니다. 그런데 만약 모집단이 대한민국국민이라면 어떨까요? 아니면 아시아 전체에대해서 알고싶을 때는 어떨까요? 돈이 너무 많이든다, 시간이 많이 소모된다와 같은 너무나도 현실적인 이유로 접근자체가 힘들 수 있는데요, 이럴 때 우리는 '추론'을 합니다... 2021. 1. 8.
[ 통계, 처음입니다] 헷갈리는 양측검정, 단측검정 (one-tailed, two-tailed) 헷갈리는 양측검정, 단측검정 one-tailed, two-tailed 이 두개는 평균이 같다고할 수 있을까? 혹은 샘플 1이 2보다 더 크다고할 수 있을까? 통계적으로는 어떻게 바라보아야할까 샘플은 각각 30개씩이고 평균은 각 551.83, 559.83이다. 흩어져있는 정도도 각각 다르다. 이 두 샘플을 어떻게 비교할 수 있을까? 유의수준은 5%로 정했다. 양측검정 두 샘플이 다른것인가. 귀무가설은 차이가 0, sample1 = sample 2가된다. 대립가설은 sample1과 sample2가 같지 않은 것이다. stats.ttest_ind(sample_data['sample1'],sample_data['sample2']) statistic=-0.11623161222764375, pvalue=0.9078.. 2021. 1. 6.
[ WEB ] CSS 문법 보호되어 있는 글 입니다. 2021. 1. 6.
[WEB] 콘텐츠모델, 시멘틱 마크업, 블록 & 인라인 보호되어 있는 글 입니다. 2021. 1. 6.
[통계, 처음입니다] 가설검정 (귀무가설과 대립가설, p-value) 통계적 가설검정 Statistical hypothesis test 귀무가설과 대립가설, p-value 통계적 가설 검정(統計的假說檢定, statistical hypothesis test)은 통계적 추측의 하나로서, 모집단 실제의 값이 얼마가 된다는 주장과 관련해, 표본의 정보를 사용해서 가설의 합당성 여부를 판정하는 과정을 의미한다. 간단히 가설 검정(假說檢定)이라고 부르는 경우가 많다. -위키백과 인용 다들 대중교통비에 얼마정도 쓸까요? 한달에 적어도 15만원은 쓰지 않을까요? 그래서 저는 가설을 하나 세웠습니다. 사람들은 대중교통비에 15만원을 쓴다! 귀무가설(H0) vs 대립가설(H1) 저는 이제 이 가설을 검정해보려고해요. 여기서 우리는 '사람들은 대중교통비에 15만원을 쓴다'라는 가설을 '귀무가.. 2021. 1. 5.
[통계, 처음입니다] 들어가며, 샘플링(표본추출) Statistics 들어가며, 샘플링(표본추출) 기술통계학 vs 추론통계학 기술 통계학(descriptive statistics)는 측정이나 실험에서 수집한 자료의 정리, 표현, 요약, 해석 등을 통해 자료의 특성을 규명하는 통계적 방법이다. 추론 통계학은 모집단에 대한 어떤 미지의 양상을 알기 위해 통계학을 이용하여 추측하는 과정을 지칭한다. 통계학의 한 부분으로서 추론 통계학이라고 불린다. 추론 통계에는 도수 확률(frequency probability)과 사전 확률(prior probability)을 기반으로 하는베이즈 추론의 두 학파가 있다. -위키백과 인용 판다스와 넘파이등을 이용해서 평균과 최소값, 최댓값, 중간값등(df.describe())을 구하고, 맷플롭립과 씨본등을 이용해서 시각화해서 .. 2021. 1. 5.
[WEB] HTML이란? 보호되어 있는 글 입니다. 2021. 1. 4.
[ 코딩, 처음입니다 ] 유니코드? 아스키? RGB? 그게뭔데 대체 유니코드? 아스키? RGB? 그게뭔데 대체 한글이 자꾸 깨지는 것에 대하여 0. 이진법과 비트 컴퓨터에 입력되는 정보들은 단순한 숫자, 문자일 수도있고 사진일 수도있고 동영상일 수도 있습니다. 정보의 형태는 너무나도 다양합니다. 어떻게 이렇게 다양한 정보를 처리할 수 있을 까요? 컴퓨터는 0과 1로 이루어진 비트(bit)로 정보를 처리합니다. 그럼 도대체 어떻게 0과 1만으로 그 많은 정보를 나타낼 수 있을까요? 0과 1은 '켜다/끄다'의 개념입니다. 실제로 컴퓨터에는 무수히 많은 트랜지스터가 있고, 이를 키고 끔으로서 0과 1을 나타냅니다. 여기서 하나, 키고 끄는 트랜지스터 하나가 한 비트라고 볼 수 있습니다. 하나의 바이트(Byte)는 8개의 비트를 의미합니다. 각 비트는 0과 1, 두가의 경우를 .. 2021. 1. 3.
1. Data Preprocess & EDA [4] CODE 1. 기본설정 # 패키지 및 폰트설정 !sudo apt-get install -y fonts-nanum !sudo fc-cache -fv !rm ~/.cache/matplotlib -rf !pip3 install numpy !pip3 install pandas import pandas as pd import numpy as np import io import seaborn as sns import matplotlib.pyplot as plt import matplotlib as mpl import warnings plt.rc('font', family='NanumBarunGothic') mpl.rc('axes', unicode_minus=False) warnings.filterwarnings("ignor.. 2021. 1. 2.
[ 코딩, 처음입니다 ] Method vs Functhion Method vs Function Function(함수) 함수는 특정 기능을 하는 역할을 합니다. 예를 들어, f(x) = x + 6 이라는 함수가 있다고합니다. 이 함수는 임의의 값에 6을 더해주는 기능을 합니다. Python에서는 다음과 같습니다. def plussix(x): print(x+6) 여기서 x는 파라미터(매개변수)가 됩니다. 경우에 따라서는 매개변수가 여러개 있을 수가 있습니다. 사람들은 기존에 이런 함수들을 무수히 많이 만들었고 우리는 너무나도 편하게 쓸 수 있습니다. 다음은 파이썬을 설치하면 내장되어있는 함수입니다. 매개변수(parameter)와 전달인자(argument)는 변수(variable)와 값(Value)의 차이입니다. f(x) = x 에서 x 는 파라미터, f(2)에서 2가.. 2021. 1. 2.