School 47

Model Selection

model selection 과정, 과정의 의미 Model Selection model 선택 model 선택 : 학습에 사용할 model 선택 param. 선택 : 다양한 model param. 중 가장 적합한 param. 선택 grid search : grid를 만들어 모든 param. 조합에 대해 교차검증 model evaluation 데이터 분할 Holdout 교차검증 (train/validation/test dataset) k-fold cross validation underfitting/overfitting 판단 : 학습 곡선과 검증 곡선 어떤 model이 가장 적합한 model인지 판단 evaluation matrix Holdout 교차검증 같은 test set을 여러번 사용하게 될 경우 te..

Preprocessing

Supervised Learning vs. Unsupervised Learning Supervised Learning Unsupervised Learning Label이 있는 (=정답이 있는) 데이터로 모델을 학습 예측하고 싶은 변수 y를 Label로 설정 학습 목표 : 정답을 맞추게 하는 것 Lablel이 없는(=정답이 없는) 데이터로 모델을 학습 데이터상에 Ground Truth가 존재하지 않음 회귀, 분류 - 회귀 : 연속적인 값을 예측 - 분류 : 이산적인 값을 예측 클러스터링 : 데이터셋을 여러 군집으로 나누는 작 Data type Numeric ratio ex) 시험점수 interval 숫자간 차이의 간격이 일정 ex) 온도 Categorical ordinal 순서 존재 ex) 등급 nomin..

4-4. logic_Theorem proving, Resolution, Forward and Backward Chaining

Theorem proving KB(우리가 알고있는 사실) 내 sentence들에 Inference rule(추론규칙)을 적용 -> 새로운 사실을 알아내는 것 Proof methods Application to inference rules Model checking 기존 문장 → 합리적인 새로운 문장 생성 inference rule application의 sequence를 통해 생성 n개의 model에 대한 Truth table 열거 model space에 대해 heuristic하게 search sound, incomplete Resolution (분해) Conjunctive Normal Form (CNF) Forward chaining 기존 알려진 사실들을 기반으로 새로운 사실을 추리하며 나아가는 방법 ..

4-3. Logic-syntax, semantics, Truth Table

Propositional logic (명제 논리) Inference soundness procedure : 해당 절차를 따라 생성된건 다 맞음 completeness procedure : 해당 절차는 모든 case를 만들어냄 first order logic : sound and complete한 inference procedure가 존재하는 logic, KB에 알려진 사실들을 기반으로 procedure 진행 Syntax atomic sentence는 1개의 proposition symbol(명제기호)로 구성 명제기호 : True이거나 False인 1개의 명제를 나타냄 ex) P, Q, R .. atomic sentence를 괄호와 logical connective(논리접속사)로 연결해서 복합 문장을 만들..

4-2. Logic-entailment, model

Logic syntax는 sentence를 만드는 규칙 formal language의 syntax는 well-formed sentence를 정의 well-formed sentence가 모여 KB를 만듦 well-formed sentence는 information을 가지며, sentence를 기반으로 conclustion을 represent할 수 있음 이처럼 conclusion을 drawn 하는 과정을 logic이라고 함 logic은 sentence의 semantics를 정의해야 함 (문장의 의미) semantics는 각 가능세계에 대한 문장의 진리(True or False)를 정의 ex) x + y = 2 라는 문장 x = 1, y = 1인 세계에서는 True x = 2, y = 1인 세계에서는 Fals..

4-1. Logic-KB, Wumpus world

Knowledge-based agents Knowledge bases (KB) KB : 문장들의 집합 (set of sentences in a formal language) - Tell : KB에 새로운 문장(지식)을 추가 - Ask : KB에 있는 문장을 질의 - Inference (추론) : Ask 연산 수행시 그에 대한 답이 반드시 KB에 Tell 연산을 통해 추가된 어떤 문장에서 도출되어야 함 Knowledge based agent agent는 사전에 자신의 KB에 일정한 Background Knowledge를 가지고 있을 수 있음 agent를 KB를 유지하고 있음 percept 1개를 입력 -> action 1개를 반환 TELL(KB, MAKE-PERCEPT-SENTENCE(percept, t)..

3. Tree Based search strategies

states : representation of a physical configuration node : search tree를 구성하는 data structure Tree search algorithms expanding states successor를 generate하면서(node를 expand 하면서) state space를 탐색하는 것 Tree Based Search strategies node를 extend 하는 순서에 따라 달라짐 Strategy 평가 Completeness : solution이 존재하는 경우 항상 찾아주는지 Time complexity : 탐색에 걸리는 시간 (탐색한 노드의 수, 생성되는 노드 수에 비례) (worst case) Space complexity : 요구하는 메모..

보안과 권한 관리

보안의 개념과 유형 권한을 부여하고 부여한 권한을 취소하는 법 역할의 개념과 필요성 역할을 이용해 권한관리 수행하는 법 권한관리 권한관리 = 접근제어 계정이 발급된 사용자가 로그인에 성공했을 경우에만 데이터베이스에 접근을 허용하는 것 - 사용자 계정 관리 -> 데이터베이스 관리자가 담당 : 각 사용자는 허용된 권한 내에서만 데이터베이스 사용 : 로그인에 성공한 사용자도 데이터베이스 사용범위, 수행가능작업에 제한 - 데이터베이스의 모든 객체 -> 객체를 생성한 사용자만 사용권한 소유주가 필요에 따라 SQL 문 이용해 다른 사용자에게 사용 권한을 부여하거나 취소 가능함 권한 관리를 통한 보안 1. GRANT 문 1-1. 객체 권한 부여 객체의 소유자가 다른 사용자에게 객체 사용권한 부여 GRANT 1)권한 ..

회복과 병행제어

트랜잭션 : 병행제어와 회복작업의 기본 단위 회복 기법 : 데이터베이스를 장애로부터 복구하는 기법 병행 제어 기법 : 여러 사용자가 동시에 접근할 수 있도록 트랜잭션 수행을 통제하는 기법 01. 트랜잭션 1. 트랜잭션의 정의 하나의 작업을 수행하는데 필요한 데이터베이스 연산들을 모아둔 것 = 작업 수행에 필요한 SQL 문들의 모임 (데이터베이스 변경하는 INSERT, DELETE, UPDATE 문의 실행) 논리적인 작업의 단위 장애 발생 시 복구작업이나 병행제어작업을 위한 단위 데이터베이스의 무결성과 일관성 보장을 위해 작업 수행에 필요한 연산들을 하나의 트랜잭션으로 정의하고 관리해야 함 EX01) 계좌이체 트랜잭션 2개의 UPDATE 문이 모두 정상적으로 실행되어야 함. 처리순서는 중요하지 않음 2. ..

정규화

정규화의 필요성과 이상 현상의 의미 정규화 수행을 위한 함수 종속의 개념 정규화의 유형, 관계 1. 정규화의 개념과 이상 현상 - 이상 현상 : 불필요한 데이터 중복으로 인해 릴레이션에 대한 데이터 삽입, 삭제, 수정 연산 수행시 발생할 수 있는 부작용 삽입 이상 새 데이터 삽입 위해 불필요한 데이터도 함께 삽입해야 하는 문제 갱신 이상 중복 투플 중 일부만 변경 -> 데이터가 불일치하게되는 모순 삭제 이상 투플을 삭제하면 필요한 데이터까지 삭제 (데이터 손실) - 정규화 : 이상현상을 제거해나가면서 데이터베이스를 올바르게 설계해나가는 과정 1) 삽입 이상 새 데이터 삽입 위해 불필요한 데이터도 함께 삽입해야 하는 문제 ex) 이벤트참여 릴레이션에 신규고객 데이터가 포함되는 경우 이벤트에 참여하지 않는 ..