분류 전체보기 186

보안과 권한 관리

보안의 개념과 유형 권한을 부여하고 부여한 권한을 취소하는 법 역할의 개념과 필요성 역할을 이용해 권한관리 수행하는 법 권한관리 권한관리 = 접근제어 계정이 발급된 사용자가 로그인에 성공했을 경우에만 데이터베이스에 접근을 허용하는 것 - 사용자 계정 관리 -> 데이터베이스 관리자가 담당 : 각 사용자는 허용된 권한 내에서만 데이터베이스 사용 : 로그인에 성공한 사용자도 데이터베이스 사용범위, 수행가능작업에 제한 - 데이터베이스의 모든 객체 -> 객체를 생성한 사용자만 사용권한 소유주가 필요에 따라 SQL 문 이용해 다른 사용자에게 사용 권한을 부여하거나 취소 가능함 권한 관리를 통한 보안 1. GRANT 문 1-1. 객체 권한 부여 객체의 소유자가 다른 사용자에게 객체 사용권한 부여 GRANT 1)권한 ..

회복과 병행제어

트랜잭션 : 병행제어와 회복작업의 기본 단위 회복 기법 : 데이터베이스를 장애로부터 복구하는 기법 병행 제어 기법 : 여러 사용자가 동시에 접근할 수 있도록 트랜잭션 수행을 통제하는 기법 01. 트랜잭션 1. 트랜잭션의 정의 하나의 작업을 수행하는데 필요한 데이터베이스 연산들을 모아둔 것 = 작업 수행에 필요한 SQL 문들의 모임 (데이터베이스 변경하는 INSERT, DELETE, UPDATE 문의 실행) 논리적인 작업의 단위 장애 발생 시 복구작업이나 병행제어작업을 위한 단위 데이터베이스의 무결성과 일관성 보장을 위해 작업 수행에 필요한 연산들을 하나의 트랜잭션으로 정의하고 관리해야 함 EX01) 계좌이체 트랜잭션 2개의 UPDATE 문이 모두 정상적으로 실행되어야 함. 처리순서는 중요하지 않음 2. ..

정규화

정규화의 필요성과 이상 현상의 의미 정규화 수행을 위한 함수 종속의 개념 정규화의 유형, 관계 1. 정규화의 개념과 이상 현상 - 이상 현상 : 불필요한 데이터 중복으로 인해 릴레이션에 대한 데이터 삽입, 삭제, 수정 연산 수행시 발생할 수 있는 부작용 삽입 이상 새 데이터 삽입 위해 불필요한 데이터도 함께 삽입해야 하는 문제 갱신 이상 중복 투플 중 일부만 변경 -> 데이터가 불일치하게되는 모순 삭제 이상 투플을 삭제하면 필요한 데이터까지 삭제 (데이터 손실) - 정규화 : 이상현상을 제거해나가면서 데이터베이스를 올바르게 설계해나가는 과정 1) 삽입 이상 새 데이터 삽입 위해 불필요한 데이터도 함께 삽입해야 하는 문제 ex) 이벤트참여 릴레이션에 신규고객 데이터가 포함되는 경우 이벤트에 참여하지 않는 ..

데이터베이스 언어 SQL_2

뷰의 개념과 장점 삽입 SQL의 역할 기본 테이블을 기반으로 만들어진 가상 테이블 기본 테이블 : 뷰를 만드는 기반이 되는 물리적 테이블 논리적으로만 존재(데이터를 실제로 저장하지 않음) 일반 테이블과 동일한 방법으로 원하는 데이터 검색 가능 다른 뷰를 기반으로 새로운 뷰 만들기 가능 뷰를 통해 기본 테이블의 내용을 쉽게 검색 가능 기본 테이블 내용을 변화시키는 작업은 제한적 CREATE VIEW 뷰 이름[(뷰를 구성하는 속성의 리스트)] AS SELECT (기존 테이블에서 SELECT 해올 것들) FROM (기존 테이블명) WITH CHECK OPTION; (SELECT 만족하는 데이터에 대해 적용할 조건) AS SELECT : 생성하려는 뷰의 정의, 기본 테이블에 대한 SELECT 문 (ORDER B..

데이터베이스 설계_E-R모델과 릴레이션 변환 규칙을 이용한 설계

데이터베이스 설계 사용자의 다양한 요구사항을 고려하여 데이터베이스를 생성하는 과정 E-R모델과 릴레이션 변환 규칙을 이용한 설계/정규화를 이용한 설계 로 구분 가능 01. E-R모델과 릴레이션 변환 규칙을 이용한 설계 1단계 : 요구사항 분석 목적 사용자의 요구사항을 수집하고 분석 -> 개발할 DB의 용도 파악 ex) 업무에 필요한 데이터가 무엇인지, 그 데이터에 어떤 처리가 필요한지 결과물 요구사항명세서 주요작업 DB를 실제로 사용할 주요 사용자의 범위 결정 사용자가 조직에서 수행하는 업무 분석 면담, 설문조사, 업무 관련 문서 분석 등의 방법 이용해 요구사항 수집 -> 요구사항을 분석한 결과를 요구사항명세서로 작성 예시 2단계 : 개념적 설계 목적 DBMS에 독립적인 개념적 스키마 설계 개념적 모델링..

카테고리 없음 2022.06.05

머신러닝_실습_3장_선형회귀분석

머신러닝의 목적 실 데이터를 바탕으로 모델을 생성 데이터 외의 다른 값을 넣었을 때 발생할 아웃풋을 예측 선형회귀 데이터를 가장 잘 설명할 수 있는 선을 찾아내는 것 식물에 대한 dataset 이라고 생각해보자. x축이 나이, y축이 키라고 했을때 해당 dataset 을 잘 설명할 수 있는 선을 하나 만든다면 같은 종의 새로운 식물에 대한 나이 data를 입력했을때 나이에 맞는 키를 예측 가능할 것이다. sample data 형성 # 임의의 샘플 데이터 생성 # y = 2x + 1 + e np.random.seed(42) x = [int(i) + np.random.randn(1) for i in np.linspace(0, 10, 10)] y = [2 * i + 1 for i in np.linspace(0..

카테고리 없음 2022.05.17

Random Forest 와 추천시스템

여러개의 DT 를 앙상블하는 알고리즘 Algorithm 1) bagging : train set 을 bootstrap (학습데이터 X로부터 N개의 sample 을 복원 추출) 2) Build DT : bagging 한 data set 이용해서 DT를 만드는데, 분류에 사용할 feature 를 random 하게 select 함 전체 feature 가 M 개라고 했을때 , m 개의 feature 를 이용하여 DT를 그림 ( m 앙상블 과정에서 분산이 줄어들기때문에, unstable 한 DT일수록 앙상블 시 효과가 좋다 3) 여러개의 DT 를 이용해 예측한 결과에 대해 majority vote 를 취한다 Increasing m good : 많은..

School/머신러닝 2022.05.10

Ensemble Learning

앙상블 학습 여러개의 분류기를 이용하여 데이터를 분류하는 방법 장점 여러 분류기를 동시에 사용함에 따라 분류 오차 감소 : 여러 독립적이고 다양한 결과를 조합할 경우, 각 개별 결과들이 최소한 random guessing 보다 우수하다면 무작위 오차들이 서로 상쇄되어 좋은 결과를 가져옴 step step1. 여러 가설(분류기) 집합을 선택 step2. 여러 분류기로부터 발생한 예측 결과를 조합 step1 에서의 방법과 step2 에서의 방법에 따라 앙상블 학습 분류 가능 step1 Homogeneous Ensemble 한 종류의 학습 방법을 사용하지만, 학습 데이터를 조작하여 서로 다른 학습데이터를 사용하여 각각 모델을 학습시킴 (다른 instance, 다른 feature 등) Heterogeneous ..

School/머신러닝 2022.05.04

알고리즘-2

kNN Classification (k-근접이웃 분류) 새로운 데이터 점이 주어지면, 주변에서 가장 가까운(유사한) k개의 점들의 클래스를 보고 판단하는 방법 kNN 분류 알고리즘 1. 주어진 모든 점들과 테스트 포인트 간의 유사도 or 거리 (𝑑(𝐱, 𝐱𝑖 )) 계산 2. 가장 가까운 점 k개를 찾고 레이블 읽기 3. k개 점들의 클래스 중 가장 빈도가 높은 클래스를 테스트 포인트의 클래스로 지정 k값의 선택 big k small k 의사결정 경계가 smooth 해짐 -> 잘 분류를 못함 -> 과소적합 상태와 유사함 -> bias 증가, variance 감소 계산시간 증가 의사결정 경계가 복잡 -> 과적합 상태와 유사함 -> bias 감소, variance 증가 이상치에 매우 민감 * bias : 편향..

알고리즘-1

알고리즘이란 ? 어떤 과제를 완수하기 위한 절차/단계/규칙 머신러닝 알고리즘? 예측, 분류, 군집화. 차원축소 등에 이용 분류문제 혹은 예측문제 선형 회귀 알고리즘 k-근접이웃 알고리즘 k-평균 알고리즘 지도학습, 예측 지도학습, 분류 비지도학습, 군집화 선형회귀 과적합과 미적합 용어 과적합 미적합 설명 모델이 학습 데이터에 대해서는 좋은 성능을 보이지만, 처음 보는 새로운 데이터에 대해서는 성능이 나빠지는 현상 (잘 일반화되지 않는 현상) 모델이 너무 단순해서 학습데이터조차 부적합 발생원인 학습 데이터 양과 노이즈 정도에 비해 모델의 복잡도가 너무 클 때 모델의 복잡도에 비해 데이터가 너무 적을 때 학습 데이터를 기억하기 시작함 - 해결책 데이터를 더 수집 더 단순한 모델 사용 데이터 특성 수 줄이기 ..