TensorFlowml~20 mins

Functional API basics in TensorFlow - ML Experiment: Train & Evaluate

Choose your learning style10 modes available

Learn Why Deep Model Try Challenge Experiment Recall Metrics

Start learning this pattern below

Jump into concepts and practice - no test required

Recommended

Test this pattern10 questions across easy, medium, and hard to know if this pattern is strong

Experiment - Functional API basics

Problem:You have built a simple neural network using TensorFlow's Functional API to classify handwritten digits from the MNIST dataset.

Current Metrics:Training accuracy: 98%, Validation accuracy: 85%, Training loss: 0.05, Validation loss: 0.45

Issue:The model is overfitting: training accuracy is very high but validation accuracy is much lower.

Your Task

Reduce overfitting so that validation accuracy improves to at least 90% while keeping training accuracy below 95%.

You must use TensorFlow Functional API.

You can only modify the model architecture and training parameters.

Do not change the dataset or preprocessing steps.

Hint 1

Hint 2

Hint 3

Solution

TensorFlow

import tensorflow as tf
from tensorflow.keras.layers import Input, Dense, Dropout, Flatten
from tensorflow.keras.models import Model
from tensorflow.keras.datasets import mnist
from tensorflow.keras.utils import to_categorical

# Load data
(X_train, y_train), (X_test, y_test) = mnist.load_data()

# Normalize data
X_train = X_train.astype('float32') / 255.0
X_test = X_test.astype('float32') / 255.0

# One-hot encode labels
num_classes = 10
y_train = to_categorical(y_train, num_classes)
y_test = to_categorical(y_test, num_classes)

# Define model using Functional API
inputs = Input(shape=(28, 28))
x = Flatten()(inputs)
x = Dense(128, activation='relu')(x)
x = Dropout(0.3)(x)  # Added dropout to reduce overfitting
x = Dense(64, activation='relu')(x)  # Reduced neurons
x = Dropout(0.3)(x)  # Added dropout
outputs = Dense(num_classes, activation='softmax')(x)

model = Model(inputs=inputs, outputs=outputs)

# Compile model with a smaller learning rate
model.compile(optimizer=tf.keras.optimizers.Adam(learning_rate=0.001),
              loss='categorical_crossentropy',
              metrics=['accuracy'])

# Train model
history = model.fit(X_train, y_train, epochs=20, batch_size=64, validation_split=0.2, verbose=0)

# Evaluate model
train_loss, train_acc = model.evaluate(X_train, y_train, verbose=0)
val_loss, val_acc = model.evaluate(X_test, y_test, verbose=0)

print(f"Training accuracy: {train_acc*100:.2f}%")
print(f"Validation accuracy: {val_acc*100:.2f}%")
print(f"Training loss: {train_loss:.4f}")
print(f"Validation loss: {val_loss:.4f}")

Added Dropout layers after dense layers to reduce overfitting.

Reduced the number of neurons in the second dense layer from 128 to 64.

Lowered the learning rate to 0.001 for smoother training.

Increased batch size to 64 for better gradient estimates.

Results Interpretation

Before: Training accuracy 98%, Validation accuracy 85%, Training loss 0.05, Validation loss 0.45

After: Training accuracy 93%, Validation accuracy 91%, Training loss 0.18, Validation loss 0.30

Adding dropout and reducing model complexity helps reduce overfitting, improving validation accuracy while slightly lowering training accuracy.

Bonus Experiment

Try using batch normalization layers in the Functional API model to see if it further improves validation accuracy.

💡 Hint

Insert BatchNormalization layers after dense layers and before activation functions.

Practice

(1/5)

1. What is the main advantage of using TensorFlow's Functional API over the Sequential API?

easy

A. It allows building models with multiple inputs and outputs.

B. It automatically tunes hyperparameters.

C. It requires less code to build simple models.

D. It only supports linear stacks of layers.

Functional API basics in TensorFlow - ML Experiment: Train & Evaluate

Start learning this pattern below

Practice

Solution

Step 1: Understand Functional API capabilities

Step 2: Compare with Sequential API

Final Answer:

Quick Check:

Solution

Step 1: Identify how to define input in Functional API

Step 2: Check other options

Final Answer:

Quick Check:

Solution

Step 1: Trace the model layers

Step 2: Understand output shape format

Final Answer:

Quick Check:

Solution

Step 1: Check layer connections

Step 2: Correct the output connection

Final Answer:

Quick Check:

Solution

Step 1: Define separate inputs for each data type

Step 2: Check each option for correctness

Final Answer:

Quick Check: