How to calculate standard deviation python

Data-analysis-pythonHow-ToBeginner · 3 min read

How to Calculate Standard Deviation in Python Easily

You can calculate standard deviation in Python using the statistics.stdev() function for sample data or statistics.pstdev() for population data. Alternatively, use numpy.std() for arrays, specifying ddof=1 for sample standard deviation.

📐

Syntax

The standard deviation can be calculated using these functions:

statistics.stdev(data): Calculates sample standard deviation.
statistics.pstdev(data): Calculates population standard deviation.
numpy.std(data, ddof=0): Calculates standard deviation; ddof=1 for sample, ddof=0 for population.

data is a list or array of numbers.

python

import statistics
import numpy as np

# Sample data
data = [10, 12, 23, 23, 16, 23, 21, 16]

# Sample standard deviation using statistics
sample_std = statistics.stdev(data)

# Population standard deviation using statistics
population_std = statistics.pstdev(data)

# Sample standard deviation using numpy
numpy_sample_std = np.std(data, ddof=1)

# Population standard deviation using numpy
numpy_population_std = np.std(data, ddof=0)

💻

Example

This example shows how to calculate both sample and population standard deviation using the statistics module and numpy. It prints the results clearly.

python

import statistics
import numpy as np

data = [10, 12, 23, 23, 16, 23, 21, 16]

# Sample standard deviation
sample_std = statistics.stdev(data)
print(f"Sample standard deviation (statistics): {sample_std:.2f}")

# Population standard deviation
population_std = statistics.pstdev(data)
print(f"Population standard deviation (statistics): {population_std:.2f}")

# Sample standard deviation with numpy
numpy_sample_std = np.std(data, ddof=1)
print(f"Sample standard deviation (numpy): {numpy_sample_std:.2f}")

# Population standard deviation with numpy
numpy_population_std = np.std(data, ddof=0)
print(f"Population standard deviation (numpy): {numpy_population_std:.2f}")

Output

Sample standard deviation (statistics): 5.24 Population standard deviation (statistics): 4.93 Sample standard deviation (numpy): 5.24 Population standard deviation (numpy): 4.93

⚠️

Common Pitfalls

Common mistakes when calculating standard deviation include:

Using population standard deviation when sample standard deviation is needed, or vice versa.
Forgetting to set ddof=1 in numpy.std() for sample standard deviation.
Passing non-numeric data or empty lists, which causes errors.

Always check if your data represents a sample or the entire population before choosing the method.

python

import numpy as np

data = [10, 12, 23, 23, 16, 23, 21, 16]

# Wrong: Using numpy.std without ddof=1 for sample
wrong_std = np.std(data)  # This calculates population std by default

# Right: Use ddof=1 for sample standard deviation
correct_std = np.std(data, ddof=1)

print(f"Wrong std (population): {wrong_std:.2f}")
print(f"Correct std (sample): {correct_std:.2f}")

Output

Wrong std (population): 4.93 Correct std (sample): 5.24

📊

Quick Reference

Summary tips for calculating standard deviation in Python:

Use statistics.stdev() for sample standard deviation.
Use statistics.pstdev() for population standard deviation.
Use numpy.std() with ddof=1 for sample, ddof=0 for population.
Ensure your data is numeric and non-empty.
Remember sample std divides by n-1, population std divides by n.

✅

Key Takeaways

Use statistics.stdev() for sample standard deviation and statistics.pstdev() for population standard deviation.

In numpy, set ddof=1 for sample standard deviation and ddof=0 for population standard deviation.

Always confirm if your data is a sample or population to choose the correct method.

Avoid passing empty or non-numeric data to these functions to prevent errors.

Sample standard deviation divides by n-1, population standard deviation divides by n.