[Data Mining] Basics Summary – Supervised & Unsupervised

By | Y2014Y2014-10M-D

* Supervised & Unsupervised Learning

 – definitions below are cited from wikipedia: –> Machine Learning

  •  Supervised learning is the machine learning task of inferring a function from labeled training data
    The training data consist of a set of training examples. In supervised learning, each example is a pair consisting of an input object (typically a vector) and a desired output value (also called the supervisory signal). A supervised learning algorithm analyzes the training data and produces an inferred function, which can be used for mapping new examples. An optimal scenario will allow for the algorithm to correctly determine the class labels for unseen instances. This requires the learning algorithm to generalize from the training data to unseen situations in a “reasonable” way (see inductive bias)….


  • In machine learning, the problem of unsupervised learning is that of trying to find hidden structure in unlabeled data. Since the examples given to the learner are unlabeled, there is no error or reward signal to evaluate a potential solution. This distinguishes unsupervised learning from supervised learning and reinforcement learning.Unsupervised learning is closely related to the problem of density estimation in statistics.[1] However unsupervised learning also encompasses many other techniques that seek to summarize and explain key features of the data. Many methods employed in unsupervised learning are based on data mining methods used to preprocess data…

     

  • 기타 – 기계학습은 그 학습 방법에 따라 크게 감독 학습(Supervised Learning)과 비감독 학습(Unsupervised Learning)으로 나누어 지는데, 감독학습은 해당자료에 대한 지식을 기반으로 학습하는 방법이며, 비감독 학습은 이러한 지식의 도움 없이 스스로 학습하는 방법이다. 감독 학습 방법에 의해 학습된 지식은 학습 알고리즘의 특성에 따라 다양한 형태(예를 들어 트리(Tree), 인스턴스(Instance), 연결강도값(Weight value), IF THEN 규칙(Rule) 등)로 표현 된다. 또 비감독 학습에 의해 만들어진 지식은 동일한 특성을 가지고 있는 자료들의 그룹(Cluster)형태로 지식이 표현된다. 네트워크 기반 침입탐지 분야에서는 감독 학습법과 비감독 학습법이 모두 사용되고 있는데, 감독 학습법이 비감독 학습법에 비해 정확도가 높다. 그러나 비감독 학습은 비록 정확도는 낮지만, 새로운 유형의 공격 감지에서는 효과적이라고 알려져 있다.
    최근까지의 학계 연구 결과에 따르면, 침입탐지 분야에 시도되었던 학습 알고리즘으로는 감독 학습에서는 결정트리(Decision Tree), 신경망(Nural Network), IBL(Instance Based Learning) 등이 있으며, 비감독 학습에서는 각종 클러스터링(Clustering) 알고리즘들이 있다…(원문)

1,834 total views, 1 views today

댓글 남기기