[BOOK] 데이터 과학으로 접근하는 정보보안 – 제이 제이콥스, 밥 루디스 지음 / 이정문 옮김
![[BOOK] 데이터 과학으로 접근하는 정보보안](https://yujaewook.files.wordpress.com/2019/08/2019-07-02-21.44.18.jpg?w=300&h=300)
부제: “데이터 분석과 시각화로 정보보안 강화하기”
데이터에 기반한, 혹은 데이터 주도의 보안이란 결국 보안 도메인에서 생성되는 데이터를 데이터 과학의 여러 기법으로 분석하고 이를 바탕으로 의사결정을 내리는 것을 의미합니다. (p. 10)
빅데이터, 데이터 과학, 인공지능으로 이어지는 변화가 많은 곳에서 나타나고 있다. 보안도 DB를 기반으로한 시그니쳐, 패턴 매칭 방식의 백신(안티 바이러스) 솔루션에서 사용자의 행동, 네트워크와 엔드포인트의 다양한 로그를 종합적으로 분석해서 위협을 판단하는 EDR(Endpoint Detection and Response) 솔루션으로 변화하고 있다.
이 책의 목표는 데이터를 바라보고 데이터로부터 무언가를 알아내는 새로운 방법을 가르치기 위한 것이다. (p. 28)
책은 데이터를 중심으로한 보안 영역의 변화와 보안 데이터들을 분석하고 그 속에서 이상징후를 포착하는 방법에 대해 설명한다. 보안 도메인에 대한 지식을 바탕으로 데이터를 분석하는 기법들을 설명한다.
한가지에 능하게 되면 만 가지에도 능하게 된다. – 미야모토 무사시, (오륜서)
도메인 영역은 다를지언정 ‘데이터 과학’, ‘데이터를 분석하는 방법’에 대한 것은 크게 다르지 않다.
- 오로지 믿음을 바탕으로 직관과 과거 사례에 의존하는 방어 기법들은 더 이상 우리들을 보호하기에 충분치 않다. (p. 20)
- 핵심은 데이터 분석과 전문지식의 결합이다. (p. 36)
- 통계학은 여러분에게 ‘실험을 설계하는 방법’에 대해 가르쳐준다. (p. 44)
- 데이터 분석의 목적은 환경으로부터 무언가를 학습하는 것임을 기억하자. (p. 48)
- 데이터를 어디서 얻을지는 더 이상 문제되지 않으며, 관건은 데이터로 무엇을 할 것인지가 중요하다. (p. 77)
- 상관관계는 둘 이상의 변수 간의 선형관계를 측정한 것이다. (p. 131)
- 상관관계는 단지 변수들 사이에 어떤 관계가 있음을 의미할 뿐이며, 인과관계를 의미하지는 않는다. (p. 132)
- 선형회귀 분석으로 알려진 통계적 기법을 적용해 다양한 데이터 간의 관계를 검사한다. (p.151)
- Z 점수는 서로 다른 스케일 상의 분포들을 비교할 때 많이 사용되며, 데이터를 ‘표준화’하는 기법으로 불리기도 한다. (p. 167)
- 진실 없이 좋은 이야기를 만들 수는 있지만, 진실 없이 좋은 데이터 이야기를 만들 수는 없다. (p. 190)
- 인간이 무언가를 이해하는 가장 효율적인 경로는 시각을 통하는 것이다. (p. 191)
- 시각화 과정에서 내리는 모든 선택은 보는 사람이 데이터의 의미를 해석하는 방법에 영향을 미친다. (p. 198)
- 수집된 데이터의 수명이 지속되는 한 비용이 기하급수적으로 증가한다. (p. 228)
- 해결해야 할 문제가 점차 미묘하고 복잡해지면서, 관계적 구조가 문제를 해결할 수 있을지에 대한 의심이 커지기 시작했다. (p. 258)
- 기계학습은 사전에 정의된 규칙과 시그니처에서 데이터로부터 직접 학습하는 컴퓨터에 의한 지속적인 적응으로 초점을 이동시켰다. (p. 300)
- 효과적인 의사전달이 시각화 결과물의 핵심 목표다. (p. 356)
- 데이터를 발견하고 분류하고 획득하고 정제하고 보충하고 처리하는 고된 작업은 여전히 필요하다. (p. 363)
- 초점을 둔 것은 바로 데이터 내에 답을 갖고 있는 좋은 질문을 찾는 것이다. (p. 397)