[AI] 실제 그래프와 랜덤 그래프 | 그래프의 경로ㆍ거리ㆍ지름 | 연결성 | 꼬리 분포 | 거대연결요소 | 군집 | 군집 계수
1. 실제 그래프 vs 랜덤 그래프 실제 그래프(Real Graph): 다양한 복잡계로부터 얻어진 그래프 예) 소셜 네트워크, 전자상거래 구매 내역, 인터넷, 웹, 뇌, 단백질 상호작용, 지식그래프 등 랜덤 그래프(Random Graph): 확률적 과정을 통해 생성한 그래프 예) 에르되스-레니 랜덤 그래프 (Erdos-Renyi Random Graph) 임의의 두 정점 사이에 간선이 존재하는지 여부는 동일한 확률 분포에 의해 결정됨 n개의 정점을 가지며, 임의의 두 개의 정점 사이에 간선이 존재할 확률은 p 정점 간의 연결은 서로 독립적(independent) 아래의 그림은 G(3, 0.3)에 의해 생성될 수 있는 그래프와 각각의 확률임 2. 그래프의 경로, 거리, 지름 정점 간 경로(Path): 정점 ..
더보기
[ML] 정형 데이터 | 비정형 데이터 | 평가지표 | 분류와 회귀 | Accuracy | Precision | Recall | ROC | AUC
01. 정형 데이터와 비정형 데이터 정형 데이터: 엑셀 파일 형식이나 관계형 데이터베이스의 테이블에 담을 수 있는 데이터 행과 열로 표현 가능한 데이터 하나의 행은 하나의 데이터 인스턴스를 나타냄 하나의 열은 데이터의 피처(속성)을 나타냄 비정형 데이터: 이미지, 비디오, 음성, 자연어 등의 정제되지 않은 데이터 틀이 없고, 테이블 형식으로 표현할 수 없는 데이터 이미지: 자율주행 자동차, 사물인식 등 음성: 음성 검색 서비스, 시리, 빅스비 등 자연어: 번역, 이메일 필터 등 02. 정형 데이터의 중요성 AI의 발전을 고려한다면, 비정형 데이터가 더 중요한거 아닌가?? 왜 정형 데이터가 중요하다고 할까?! 사람, 기업, 현상 등 사회의 많은 부분들이 정형데이터로 기록되기 때문! 이 외에도 정형 데이터는..
더보기