data

    ADsP μ‹œν—˜μ€€λΉ„ 3κ³Όλͺ© 데이터뢄석(1)

    ADsP μ‹œν—˜μ€€λΉ„ 3κ³Όλͺ© 데이터뢄석(1)

    01. R 기초 1. R 언어와 문법 *주석 : # 이후에 μž‘μ„± 1) R의 데이터 ꡬ쑰 ) (좜처 R in Action(23p)) 2) 벑터 벑터 λ°μ΄ν„°κ΅¬μ‘°λŠ” ν•˜λ‚˜μ˜ 슀칼라 κ°’, ν˜Ήμ€ ν•˜λ‚˜ μ΄μƒμ˜ 슀칼라 μ›μ†Œλ₯Ό κ°–λŠ” μžλ£Œκ΅¬μ‘°μ΄λ‹€. λ²‘ν„°λŠ” μžλ°”μ—μ„œ μ‚¬μš©ν•˜λŠ” 일차원 λ°°μ—΄κ³Ό λŠλ‚Œμ΄ λΉ„μŠ·ν•˜λ‹€. κ·Έ μ΄μœ λŠ” λ™μΌν•œ 데이터 ν˜•νƒœλ₯Ό 가진 μ›μ†Œλ“€μ˜ 집합이기 λ•Œλ¬Έμ΄λ‹€. 벑터 μƒμ„±ν•˜λŠ” 법 : c() λ²‘ν„°μ˜ μ›μ†Œ μœ ν˜• μˆ«μžν˜• 벑터 λ¬Έμžν˜• 벑터 논리 μ—°μ‚°μž 벑터 사둀 x = c(1,2,3,4) y = c(β€œμ‚¬κ³Όβ€,”망고”) z = c(TRUE, FALSE) μ—¬κΈ°μ„œ μ•Œμ•„ λ‘μ–΄μ•Όν•˜λŠ” 것은, TRUEλ₯Ό 숫자둜 μ‚¬μš©ν•˜λ©΄ 1, FALSEλŠ” 0이 λœλ‹€λŠ” 것이닀. 그리고 논리값은 항상 λͺ¨λ‘ λŒ€λ¬Έμžλ‘œ μ‚¬μš©ν•΄μ•Όν•œλ‹€. μ„œλ‘œ λ‹€λ₯Έ μœ ν˜•μ˜ 데이터λ₯Ό..

    ADsP μ‹œν—˜μ€€λΉ„ 2κ³Όλͺ© 데이터 뢄석 기획(2)

    ADsP μ‹œν—˜μ€€λΉ„ 2κ³Όλͺ© 데이터 뢄석 기획(2)

    01. 뢄석 λ§ˆμŠ€ν„°ν”Œλžœ 수립 뢄석 λ§ˆμŠ€ν„°ν”Œλžœμ€ 뢄석 λŒ€μƒμ΄ λ˜λŠ” 과제λ₯Ό λ„μΆœν•˜κ³ , μš°μ„ μˆœμœ„λ₯Ό κ³„μ‚°ν•˜μ—¬ μ„ΈλΆ€ 이행 κ³„νšμ„ μˆ˜λ¦½ν•˜λŠ” λ‘œλ“œλ§΅μ„ μž‘μ„±ν•˜λŠ” 것을 μ˜λ―Έν•œλ‹€. λ˜ν•œ 뢄석 λ‘œλ“œλ§΅μƒμ˜ κ³Όμ œκ°€ 잘 μˆ˜ν–‰λ˜κΈ° μœ„ν•˜μ—¬ 뢄석 κ±°λ²„λ„ŒμŠ€μ˜ 체계λ₯Ό μˆ˜λ¦½ν•˜λŠ” 것을 μ˜λ―Έν•œλ‹€. 1. 뢄석 λ§ˆμŠ€ν„°ν”Œλžœ 수립 ν”„λ ˆμž„ μ›Œν¬ 쀑 μž₯기적인 κ΄€μ μ˜ λ§ˆμŠ€ν„°ν”Œλžœμ„ μˆ˜λ¦½ν•˜κΈ° μœ„ν•΄μ„œ λΆ„μ„κ³Όμ œλ₯Ό λŒ€μƒμœΌλ‘œ μ „λž΅μ  μ€‘μš”λ„, λΉ„μ¦ˆλ‹ˆμŠ€μ˜ μ„±κ³Ό 및 ROI(투자 회수율), λΆ„μ„κ³Όμ œμ˜ λ‚œμ΄λ„ λ“±μ˜ λ‹€μ–‘ν•œ 기쀀을 κ³ λ €ν•΄ μš°μ„ μˆœμœ„λ₯Ό μ„ μ •ν•΄μ•Όν•œλ‹€. κ·Έ 외에 뢄석 데이터λ₯Ό λ‚΄λΆ€ 데이터λ₯Ό μ‚¬μš©ν• μ§€ ν˜Ήμ€ μ™ΈλΆ€ 데이터λ₯Ό μ‚¬μš©ν• μ§€, 뢄석 κΈ°μˆ μ€ μ–΄λŠ 기술 μš”μ†ŒκΉŒμ§€ μ μš©ν•  것인지 λ“± λΆ„μ„μ˜ 적용 λ²”μœ„ 및 방식에 λŒ€ν•˜μ—¬λ„ μ’…ν•©μ μœΌλ‘œ κ³ λ €ν•΄ λ‘œλ“œλ§΅μ„ μˆ˜λ¦½ν•΄μ•Όν•œλ‹€. (λ§ˆμŠ€ν„°ν”Œλžœ..

    ADsP μ‹œν—˜μ€€λΉ„ 2κ³Όλͺ© 데이터 뢄석 기획(1)

    ADsP μ‹œν—˜μ€€λΉ„ 2κ³Όλͺ© 데이터 뢄석 기획(1)

    01. 뢄석 기획 λ°©ν–₯μ„± λ„μΆœ 1. 뢄석 기획의 νŠΉμ§• 뢄석 κΈ°νšμ€ μ‹€μ œ 뢄석을 μˆ˜ν–‰ν•˜κΈ° 전에 뢄석을 μˆ˜ν–‰ν•  과제의 μ •μ˜ 및 μ›ν•˜λŠ” κ²°κ³Όλ₯Ό 얻을 수 μžˆλ„λ‘ 이λ₯Ό 적절히 관리할 수 μžˆλŠ” κ΄€λ¦¬λ°©μ•ˆμ„ κ³„νšν•˜λŠ” μž‘μ—…μ΄λ‹€. μ–΄λ– ν•œ λͺ©ν‘œ(What)을 λ‹¬μ„±ν•˜κΈ°μœ„ν•΄ μ–΄λ– ν•œ 방법(How)을 μˆ˜ν–‰ν•  지 일련의 κ³„νšμ„ μˆ˜λ¦½ν•˜λŠ” 과정이닀. 뢄석을 κΈ°νšν•˜κΈ° μœ„ν•΄μ„œλŠ” ν•΄λ‹Ή 문제 μ˜μ—­μ— λŒ€ν•œ β€˜μ „λ¬Έμ„± μ—­λŸ‰β€™ 및 톡계학적 지식을 ν™œμš©ν•œ β€˜λΆ„μ„ μ—­λŸ‰β€™ 그리고 λΆ„μ„μ˜ 도ꡬ인 β€˜ν”„λ‘œκ·Έλž˜λ° 뢄석 μ—­λŸ‰β€™μ— λŒ€ν•΄ κ· ν˜• 작힌 μ‹œκ°μ„ 가지고 λ°©ν–₯μ„± 및 κ³„νšμ„ μˆ˜λ¦½ν•΄μ•Ό ν•  것이닀.(λΉ„μ¦ˆλ‹ˆμŠ€ 뢄석 λŠ₯λ ₯ + 톡계학 지식 + 데이터 ν”„λ‘œκ·Έλž˜λ° λŠ₯λ ₯ = 데이터 μ‚¬μ΄μ–ΈμŠ€) 1) 뢄석 주제 μœ ν˜• λΆ„μ„μ˜ λŒ€μƒκ³Ό λΆ„μ„μ˜ 방법을 μ•„λŠ”μ§€μ— λ”°λΌμ„œ, 4κ°€μ§€μ˜ μœ ν˜•μœΌλ‘œ ..

    ADsP μ‹œν—˜μ€€λΉ„ 1κ³Όλͺ© λ°μ΄ν„°μ˜ 이해(3)

    ADsP μ‹œν—˜μ€€λΉ„ 1κ³Όλͺ© λ°μ΄ν„°μ˜ 이해(3)

    01. λΉ… 데이터 뢄석과 μ „λž΅ μΈμ‚¬μ΄νŠΈ 1. μ™œ μ‹Έμ΄μ›”λ“œλŠ” 페이슀뢁이 λ˜μ§€ λͺ»ν•˜μ˜€λŠ”κ°€? κ΅¬κΈ€μ΄λ‚˜ 페이슀뢁 같은 성곡적인 인터넷 기업은 λŒ€λΆ€λΆ„ 데이터뢄석과 ν•¨κ»˜ μ‹œμž‘λ˜λ©° κ·Έ κ²°κ³Όκ°€ μ˜μ‚¬κ²°μ •μ— 결정적인 정보λ₯Ό μ œκ³΅ν•œλ‹€. 반면 μ‹Έμ΄μ›”λ“œλŠ” 직관에 μ˜κ±°ν•˜μ—¬ μ˜μ‚¬κ²°μ •μ„ μˆ˜ν–‰ν•˜μ˜€λ‹€. 즉 데이터 뢄석을 ν™œμš©ν•˜μ—¬ μ „λž΅μ  톡찰을 μ–»κ³ , 효과적인 μ˜μ‚¬κ²°μ •μ„ μˆ˜ν–‰ν•˜μ§€ μ•Šμ•˜κΈ° λ•Œλ¬Έμ΄λ‹€. 2. λΉ… 데이터 뢄석, β€œBig”이 핡심이 μ•„λ‹ˆλ‹€. 데이터가 λ§Žλ‹€κ³  ν•΄μ„œ 항상 더 λ§Žμ€ κ°€μΉ˜λ₯Ό μ°½μΆœν•˜λŠ” 것은 μ•„λ‹ˆλ‹€. λ‹€λ§Œ λ°μ΄ν„°λŠ” μŒμ„±, ν…μŠ€νŠΈ, μ˜μƒ λ“±μœΌλ‘œ λ‹€μ–‘ν•˜κ²Œ λ°œμ „ν•˜κ³  μžˆλ‹€. μ΄λ ‡κ²Œ μƒˆλ‘­κ³  λ‹€μ–‘ν•œ μœ ν˜•μ˜ 데이터λ₯Ό 효율적으둜 ν™œμš©ν•˜λ©΄ 더 λ§Žμ€ 핡심 κ°€μΉ˜λ₯Ό 얻을 수 μžˆμ„ κ²ƒμœΌλ‘œ κΈ°λŒ€λœλ‹€. 즉 λΉ… λ°μ΄ν„°μ˜ 핡심은 양이 μ•„λ‹ˆλΌ μœ ν˜•μ˜ λ‹€μ–‘μ„±..

    ADsP μ‹œν—˜μ€€λΉ„ 1κ³Όλͺ© λ°μ΄ν„°μ˜ 이해(2)

    ADsP μ‹œν—˜μ€€λΉ„ 1κ³Όλͺ© λ°μ΄ν„°μ˜ 이해(2)

    01 λΉ…λ°μ΄ν„°μ˜ 이해 1. λΉ… λ°μ΄ν„°μ˜ μ •μ˜ λΉ…λ°μ΄ν„°λŠ” μ†Œν”„νŠΈμ›¨μ–΄λ‘œ μ €μž₯, 관리, 뢄석할 수 μžˆλŠ” λ²”μœ„λ₯Ό μ΄ˆκ³Όν•˜λŠ” 규λͺ¨μ˜ 데이터이닀. λΉ… λ°μ΄ν„°λŠ” 3V의 μ •μ˜λ₯Ό 가진닀. Volume (λ°μ΄ν„°μ˜ 크기) : μƒμ„±λ˜λŠ” 데이터가 맀우 많음 Variety (λ°μ΄ν„°μ˜ λ‹€μ–‘μ„±) : λ°μ΄ν„°μ˜ μ’…λ₯˜κ°€ λΉ„μ •ν˜• λ°μ΄ν„°μ²˜λŸΌ 닀양해짐. Velocity (λ°μ΄ν„°μ˜ 속도) : 데이터λ₯Ό μ—…λ°μ΄νŠΈν•˜κ±°λ‚˜ 뢄석이 λΉ λ₯΄κ²Œ 됨. 2. μΆœν˜„ λ°°κ²½ (산업계) 고객의 데이터λ₯Ό 좕적해 μˆ¨μ–΄μžˆλŠ” κ°€μΉ˜λ₯Ό λ°œκ΅΄ν•΄ μƒˆλ‘œμš΄ μ„±μž₯ 동λ ₯μ›μœΌλ‘œ λ§Œλ“€μ–΄ 냄 (학계) κ±°λŒ€ 데이터 ν™œμš© 과학이 확산됨(인간 κ²Œλ†ˆ ν”„λ‘œμ νŠΈ) (κ΄€λ ¨ 기술의 λ°œμ „) 인터넷 보급, λͺ¨λ°”일 혁λͺ…, ν΄λΌμš°λ“œ μ»΄ν“¨νŒ…μ˜ λ°œμ „ (*λ°μ΄ν„°μ˜ 규λͺ¨) 1ν…ŒλΌ λ°”μ΄νŠΈ = 1024 κΈ°κ°€ λ°”μ΄νŠΈ 1νŽ˜νƒ€ λ°”μ΄νŠΈ ..

    ADsP μ‹œν—˜μ€€λΉ„ 1κ³Όλͺ© λ°μ΄ν„°μ˜ 이해(1)

    ADsP μ‹œν—˜μ€€λΉ„ 1κ³Όλͺ© λ°μ΄ν„°μ˜ 이해(1)

    μš”μ•½μ— μ•žμ„œ ν¬μŠ€νŒ…μ„ μ§„μ§œ μ˜€λžœλ§Œμ— ν•˜λŠ” 것 κ°™μŠ΅λ‹ˆλ‹€. 졜근 μ½”λ‘œλ‚˜ λ°”μ΄λŸ¬μŠ€ λ•Œλ¬Έμ— 집에 λͺ»κ°€κ³  계속 OBC μƒν™œμ„ν•˜λ©° μ§€λ‚΄λŠλΌ ν¬μŠ€νŒ…μ΄ λŠ¦μ–΄μ‘ŒμŠ΅λ‹ˆλ‹€.. μ–Έμ œκΉŒμ§€ κ°–ν˜€μžˆμ„μ§€ λͺ¨λ₯΄κ² μ§€λ§Œ.. 빨리 상황이 쒋아지길 κΈ°λŒ€ν•©λ‹ˆλ‹€. μ§€κΈˆλ„ μ—¬μ „νžˆ 정보톡신학ꡐ에 κ°–ν˜€μžˆμ§€λ§Œ, 자격증 μ‹œν—˜ μ€€λΉ„λ₯Ό ν•˜λ©° μš”μ•½μ •λ¦¬λ₯Ό ν•  κ²Έ 글을 μ“°κ²Œ λ˜μ—ˆμŠ΅λ‹ˆλ‹€. μ € 처럼 ADsPμžκ²©μ¦μ„ μ€€λΉ„ν•˜λŠ” 뢄듀이 이 글을 보고 μ‘°κΈˆμ΄λ‚˜λ§ˆ 도움을 λ°›κΈ°λ₯Ό κΈ°λŒ€ν•©λ‹ˆλ‹€. 참고둜 책은 μ•„λž˜ 두 κΆŒμ„ ν™œμš©ν•˜μ—¬ κ³΅λΆ€ν•˜λŠ” μ€‘μž…λ‹ˆλ‹€. μœ„ 책은 κ°œλ…μ„ μ •λ¦¬ν•˜κ³  문제λ₯Ό ν’€ μš©λ„λ‘œ κ΅¬λ§€ν•˜μ˜€μŠ΅λ‹ˆλ‹€. (아직 ν’€μ–΄λ³΄μ§€λŠ” λͺ»ν•˜μ˜€μ§€λ§Œ, ꡉμž₯히 μœ μ΅ν•˜λ‹€λŠ” 평이 λ§ŽμŠ΅λ‹ˆλ‹€.) κ°œλ…μ„ 정리할 κ°œλ…μ„œλ‘œ μœ„ 책을 κ΅¬λ§€ν•˜μ˜€μŠ΅λ‹ˆλ‹€. 01. 데이터와 정보 1. λ°μ΄ν„°μ˜ μ •μ˜ λ°μ΄ν„°λŠ” 객관적인 사..