SPOF란 단일 장애점 또는 단일 고장점이라고 부르며 어떤 시스템에서 한 지점의 장애로 인해 시스템 전체에 장애가 발생하게 하는 지점을 의미한다.
단일 서버가 단일 애플리케이션을 실행하는 데이터 센터를 예시로 들어보자. 서버 하드웨어는 애플리케이션의 가용성에 단일 장애 지점을 제공한다. 서버에 오류가 발생하면 애플리케이션이 불안정해지거나 완전히 손상될 수 있다. (중요한 데이터가 날아갈 수 있다.)
이런 상황에서 단순하게 애플리케이션을 각각의 물리 서버에서 따로 띄워서 SPOF의 한 부분을 제거할 수 있다. 1, 2번 물리 서버에서 각각 애플리케이션을 띄웠다면, 1번 서버에 장애 발생 시 2번 서버가 애플리케이션에 대한 처리를 진행하고, 1번 서버의 장애를 해결하거나 (1번 서버가 장애가 발생했기 때문에, 2번 서버밖에 남지 않아서)새로 생긴 SPOF를 제거하기 위해 새로운 물리서버를 추가해서 새롭게 애플리케이션을 띄워야 한다.
만약 서버들이 단일 네트워크 스위치(Switch A)를 통해서 네트워크에 연결되는 상황이 있다면, 여기서 단일 네트워크 스위치(Switch A)는 SPOF 지점이다. 여기서 이 Switch A가 고장나거나, 전원과 연결이 끊어지거나 하면 그 스위치와 연결된 모든 서버는 네트워크가 끊어지는 것이다. 그래서 이것도 다중화 해야 하는데, redundant switch와 네트워크 연결은 원래 서버가 고장나면 대체로 사용해야 하는 네트워크 경로를 제공해서 다중화 해야한다.
이론적으로는 모든 SPOF에 대해서 다중화 처리가 되어야 하나, 비용과 효율적인 측면을 현실적으로 적절히 따져서 설계해야 할 것.