Графикът на разсейване е важен инструмент за диагностика в арсенала на статистиците, получен чрез начертаване на две променливи една срещу друга. Това позволява на статистиката да разгледа променливите и да формира работеща хипотеза за тяхната връзка. Поради тази причина обикновено се изготвя преди да се направи регресионен анализ. Впоследствие статистикът тества хипотезата, използвайки регресионен анализ и определя знака и точната величина на връзката. Освен това, графика за разсейване помага да се идентифицират остатъците - стойности, които са необичайно отдалечени от повечето данни в извадката. Елиминирането на външните хора спомага за подобряване на модела на регресия.
Проверете за отрицателна връзка между двете променливи в графика на разсейване. Ако ниските стойности на първата променлива съответстват на високите стойности на втората променлива, има отрицателна корелация. В този случай линия, изтеглена през точките с данни, има отрицателен наклон.
Разгледайте графика на разсейване за положителна връзка между променливите. Ако ниските стойности на първата променлива в графика на разсейване съответстват на ниските стойности на втората, а високите стойности на първата по същия начин съответстват на високите стойности на втората, променливите имат положителна корелация. В този случай линия, изтеглена през точките с данни, има положителен наклон.
Проверете графика на разсейване за никаква връзка между променливите. Ако точките от данните в графика на разсейване са разпределени на случаен принцип без видима връзка между двете, те нямат или никаква корелация, или малка, статистически незначителна корелация. В този случай линия, изтеглена през точките с данни, е хоризонтална с наклон, равен на нула.
Поставете линия през точките от данни и проучете нейната форма, за да прецените естеството на връзката между двете променливи. Правата линия се интерпретира като линейна връзка, извитата форма подсказва квадратична връзка, а линията, която лежи сравнително плоска, преди внезапно стрелба нагоре или надолу, се интерпретира като експоненциална връзка.
Разгледайте графика на разсейване за отшелници, стойности, които лежат необичайно далеч от струпването на точки от данни. Отшелниците нарушават връзката между променливите. Елиминирайте ги, но само ако тяхното отсъствие не влияе върху анализа на връзката между двете променливи.