10 Beginner Tips for Building Your First Neural Network

[{"selector":"#anim-bf1449cc-480a-4162-b7e4-6d4d34c11500","keyframes":{"opacity":[0,1]},"delay":0,"duration":600,"easing":"cubic-bezier(0.2, 0.6, 0.0, 1)","fill":"both"}] [{"selector":"#anim-62357acb-abfa-4589-b11d-1cc7f5b57766","keyframes":{"transform":["translate3d(0px, 75.91351%, 0)","translate3d(0px, 0px, 0)"]},"delay":0,"duration":600,"easing":"cubic-bezier(0.2, 0.6, 0.0, 1)","fill":"both"}] [{"selector":"#anim-549bc215-f72b-491d-bc28-290568d17926","keyframes":{"opacity":[0,1]},"delay":0,"duration":2000,"easing":"cubic-bezier(.3,0,.55,1)","fill":"both"}] [{"selector":"#anim-28415c71-9cb7-4828-9ebd-b878baa7ef11","keyframes":{"transform":["scale(0.3333333333333333)","scale(1)"]},"delay":0,"duration":2000,"easing":"cubic-bezier(.3,0,.55,1)","fill":"forwards"}] [{"selector":"#anim-140ee8ef-1ea4-4c7a-aa05-47db9deb5afc","keyframes":{"transform":["translate3d(54.54548%, 0px, 0)","translate3d(0px, 0px, 0)"]},"delay":800,"duration":1000,"easing":"cubic-bezier(.2, 0, .8, 1)","fill":"both"}] [{"selector":"#anim-16b763af-e69a-443c-bc23-fbb99afbd3c7","keyframes":{"transform":["rotateZ(180deg)","rotateZ(0deg)"]},"delay":800,"duration":1000,"easing":"cubic-bezier(.2, 0, .5, 1)","fill":"forwards"}] [{"selector":"#anim-0294ec3e-1dab-4680-b5f3-d1e9430206e5","keyframes":{"transform":["translate3d(-54.54544%, 0px, 0)","translate3d(0px, 0px, 0)"]},"delay":500,"duration":1000,"easing":"cubic-bezier(.2, 0, .8, 1)","fill":"both"}] [{"selector":"#anim-3607a831-730b-4aa5-9b0b-7d232705970e","keyframes":{"transform":["rotateZ(-180deg)","rotateZ(0deg)"]},"delay":500,"duration":1000,"easing":"cubic-bezier(.2, 0, .5, 1)","fill":"forwards"}] [{"selector":"#anim-d94922ca-03f7-4f1b-9783-1417f6cadf2a","keyframes":{"opacity":[1,1]},"delay":0,"duration":2000,"easing":"cubic-bezier(.3,0,.55,1)","fill":"both"}] [{"selector":"#anim-665b1ace-26eb-4d3e-b807-93ddbc214d8b","keyframes":{"transform":["scale(3)","scale(1)"]},"delay":0,"duration":2000,"easing":"cubic-bezier(.3,0,.55,1)","fill":"forwards"}] Dipping your toes into deep learning and neural networks for the first time? Here are 10 key tips to successfully train your first basic AI model .

Start with Simple Datasets

[{"selector":"#anim-fafe72c9-1fb9-4574-b375-5e5553246df4","keyframes":{"opacity":[0,1]},"delay":0,"duration":600,"easing":"cubic-bezier(0.2, 0.6, 0.0, 1)","fill":"both"}] [{"selector":"#anim-a6a32536-1d0d-49ea-8299-984f70ce9dbe","keyframes":{"transform":["translate3d(0px, 75.91351%, 0)","translate3d(0px, 0px, 0)"]},"delay":0,"duration":600,"easing":"cubic-bezier(0.2, 0.6, 0.0, 1)","fill":"both"}] [{"selector":"#anim-cee959ac-abb8-44b6-aa0e-073ded06b1b8","keyframes":{"opacity":[0,1]},"delay":200,"duration":600,"easing":"cubic-bezier(0.2, 0.6, 0.0, 1)","fill":"both"}] [{"selector":"#anim-c124d7cd-dcd5-4ceb-9354-e14a2f6fdc6d","keyframes":{"transform":["translate3d(0px, -862.25784%, 0)","translate3d(0px, 0px, 0)"]},"delay":200,"duration":600,"easing":"cubic-bezier(0.2, 0.6, 0.0, 1)","fill":"both"}] [{"selector":"#anim-96340dc4-2e57-436d-80ae-7a9ae57cd31c","keyframes":{"opacity":[0,1]},"delay":0,"duration":2000,"easing":"cubic-bezier(.3,0,.55,1)","fill":"both"}] [{"selector":"#anim-2f8dd7cb-c115-42d1-afc1-16d5dbec7798","keyframes":{"transform":["scale(0.3333333333333333)","scale(1)"]},"delay":0,"duration":2000,"easing":"cubic-bezier(.3,0,.55,1)","fill":"forwards"}] [{"selector":"#anim-335d1ba6-e052-462a-a876-f1ab09f96e25","keyframes":{"opacity":[0,1]},"delay":400,"duration":600,"easing":"cubic-bezier(0.2, 0.6, 0.0, 1)","fill":"both"}] [{"selector":"#anim-bd8a333d-e405-4cb0-aabc-e9e4dcc3acca","keyframes":{"transform":["translate3d(0px, 385.84241%, 0)","translate3d(0px, 0px, 0)"]},"delay":400,"duration":600,"easing":"cubic-bezier(0.2, 0.6, 0.0, 1)","fill":"both"}] [{"selector":"#anim-6cd92127-9526-4c82-8bc8-d4dd3bcfd9a4","keyframes":{"opacity":[1,1]},"delay":0,"duration":2000,"easing":"cubic-bezier(.3,0,.55,1)","fill":"both"}] [{"selector":"#anim-9f0165af-d6e4-4e5c-89bb-87cec36e8b87","keyframes":{"transform":["scale(3)","scale(1)"]},"delay":0,"duration":2000,"easing":"cubic-bezier(.3,0,.55,1)","fill":"forwards"}] Begin by training your neural network on fundamental labeled datasets like MNIST digits or CIFAR-10 objects. These approachable options teach the basics before tackling more complex data.

Leverage Pre-Made Libraries

[{"selector":"#anim-728d51b2-fd77-49a3-8c1e-cdc00fa24297","keyframes":{"opacity":[1,1]},"delay":0,"duration":2000,"easing":"cubic-bezier(.3,0,.55,1)","fill":"both"}] [{"selector":"#anim-9c0e88d8-4b42-48ff-8a36-9c8f2ecee7d2","keyframes":{"transform":["scale(3)","scale(1)"]},"delay":0,"duration":2000,"easing":"cubic-bezier(.3,0,.55,1)","fill":"forwards"}] [{"selector":"#anim-2f0b866b-e637-4a9b-a138-a7c0fd4303e0","keyframes":{"opacity":[0,1]},"delay":0,"duration":600,"easing":"cubic-bezier(0.2, 0.6, 0.0, 1)","fill":"both"}] [{"selector":"#anim-7f1ab997-9482-4ee0-a127-3a67dee7b221","keyframes":{"transform":["translate3d(0px, 75.91351%, 0)","translate3d(0px, 0px, 0)"]},"delay":0,"duration":600,"easing":"cubic-bezier(0.2, 0.6, 0.0, 1)","fill":"both"}] [{"selector":"#anim-5baf2122-2a66-4d95-bad2-869aeed8bb57","keyframes":{"opacity":[0,1]},"delay":200,"duration":600,"easing":"cubic-bezier(0.2, 0.6, 0.0, 1)","fill":"both"}] [{"selector":"#anim-ff21eebf-70cc-4039-8e9c-74ed760aae5d","keyframes":{"transform":["translate3d(0px, -862.25784%, 0)","translate3d(0px, 0px, 0)"]},"delay":200,"duration":600,"easing":"cubic-bezier(0.2, 0.6, 0.0, 1)","fill":"both"}] [{"selector":"#anim-5617b0c6-e09e-49c3-bab3-c3e4c5e6ca0b","keyframes":{"opacity":[0,1]},"delay":400,"duration":600,"easing":"cubic-bezier(0.2, 0.6, 0.0, 1)","fill":"both"}] [{"selector":"#anim-dfc116a7-04fc-40f0-9af2-f16899731260","keyframes":{"transform":["translate3d(0px, 385.84241%, 0)","translate3d(0px, 0px, 0)"]},"delay":400,"duration":600,"easing":"cubic-bezier(0.2, 0.6, 0.0, 1)","fill":"both"}] [{"selector":"#anim-109e05da-54a5-4356-b734-bb4a634201eb","keyframes":{"opacity":[0,1]},"delay":0,"duration":2000,"easing":"cubic-bezier(.3,0,.55,1)","fill":"both"}] [{"selector":"#anim-a23d3f3f-71c8-4149-a7d6-e7eb997f53fc","keyframes":{"transform":["scale(0.3333333333333333)","scale(1)"]},"delay":0,"duration":2000,"easing":"cubic-bezier(.3,0,.55,1)","fill":"forwards"}] Use Python deep learning libraries like TensorFlow, PyTorch, or Keras so you don't have to code all the math from scratch. They provide pre-built layers and functions.

Keep Your Network Small

[{"selector":"#anim-13ca28de-4849-4037-94c6-ac231d869fd4","keyframes":{"opacity":[1,1]},"delay":0,"duration":2000,"easing":"cubic-bezier(.3,0,.55,1)","fill":"both"}] [{"selector":"#anim-685db97c-1690-49bf-bf35-ae8d8651fe3a","keyframes":{"transform":["scale(3)","scale(1)"]},"delay":0,"duration":2000,"easing":"cubic-bezier(.3,0,.55,1)","fill":"forwards"}] [{"selector":"#anim-5a1e90dd-f2b1-4b18-8605-0b13ba731c0c","keyframes":{"opacity":[0,1]},"delay":0,"duration":600,"easing":"cubic-bezier(0.2, 0.6, 0.0, 1)","fill":"both"}] [{"selector":"#anim-9d8306e3-28ac-43fb-aaec-51711e765014","keyframes":{"transform":["translate3d(0px, 75.91351%, 0)","translate3d(0px, 0px, 0)"]},"delay":0,"duration":600,"easing":"cubic-bezier(0.2, 0.6, 0.0, 1)","fill":"both"}] [{"selector":"#anim-c1caa3c0-0b70-4804-8030-d673dce1d08b","keyframes":{"opacity":[0,1]},"delay":200,"duration":600,"easing":"cubic-bezier(0.2, 0.6, 0.0, 1)","fill":"both"}] [{"selector":"#anim-3ffd7010-1529-46be-9f48-de8db846ecc1","keyframes":{"transform":["translate3d(0px, -862.25784%, 0)","translate3d(0px, 0px, 0)"]},"delay":200,"duration":600,"easing":"cubic-bezier(0.2, 0.6, 0.0, 1)","fill":"both"}] [{"selector":"#anim-86654e9f-e88c-4878-a321-67392bafc684","keyframes":{"opacity":[0,1]},"delay":400,"duration":600,"easing":"cubic-bezier(0.2, 0.6, 0.0, 1)","fill":"both"}] [{"selector":"#anim-63bebe61-c48b-4ec2-9cd8-8dd12e9aa401","keyframes":{"transform":["translate3d(0px, 747.57000%, 0)","translate3d(0px, 0px, 0)"]},"delay":400,"duration":600,"easing":"cubic-bezier(0.2, 0.6, 0.0, 1)","fill":"both"}] [{"selector":"#anim-0aefb5a1-4658-40a2-ba97-90c822c1b19b","keyframes":{"opacity":[0,1]},"delay":0,"duration":2000,"easing":"cubic-bezier(.3,0,.55,1)","fill":"both"}] [{"selector":"#anim-62d50969-c980-4267-9490-b70b6a833a79","keyframes":{"transform":["scale(0.3333333333333333)","scale(1)"]},"delay":0,"duration":2000,"easing":"cubic-bezier(.3,0,.55,1)","fill":"forwards"}] A network with only a couple layers (input, hidden, output) is easier to train initially. Once you grasp basics, experiment with deeper architectures.

Split Your Data

[{"selector":"#anim-dcd4eaa9-6a4b-4cd0-865e-d5026a329a84","keyframes":{"opacity":[1,1]},"delay":0,"duration":2000,"easing":"cubic-bezier(.3,0,.55,1)","fill":"both"}] [{"selector":"#anim-cfc48544-cd46-4824-a6ab-d9add5f822d2","keyframes":{"transform":["scale(3)","scale(1)"]},"delay":0,"duration":2000,"easing":"cubic-bezier(.3,0,.55,1)","fill":"forwards"}] [{"selector":"#anim-670c51cd-6dbc-4e2c-8f17-f4f147fb4e43","keyframes":{"opacity":[0,1]},"delay":0,"duration":600,"easing":"cubic-bezier(0.2, 0.6, 0.0, 1)","fill":"both"}] [{"selector":"#anim-89a1fc72-0210-418b-bfff-64e6fa6b257c","keyframes":{"transform":["translate3d(0px, 75.91351%, 0)","translate3d(0px, 0px, 0)"]},"delay":0,"duration":600,"easing":"cubic-bezier(0.2, 0.6, 0.0, 1)","fill":"both"}] [{"selector":"#anim-7912b2ef-9892-4b5d-aeca-8af0a7600135","keyframes":{"opacity":[0,1]},"delay":200,"duration":600,"easing":"cubic-bezier(0.2, 0.6, 0.0, 1)","fill":"both"}] [{"selector":"#anim-c396a841-a985-4a82-bc70-91eef95780ed","keyframes":{"transform":["translate3d(0px, -862.25784%, 0)","translate3d(0px, 0px, 0)"]},"delay":200,"duration":600,"easing":"cubic-bezier(0.2, 0.6, 0.0, 1)","fill":"both"}] [{"selector":"#anim-cf561ba5-3d7f-4973-a177-ee74ae19806d","keyframes":{"opacity":[0,1]},"delay":400,"duration":600,"easing":"cubic-bezier(0.2, 0.6, 0.0, 1)","fill":"both"}] [{"selector":"#anim-66852ab1-7142-4f51-9c35-33c256ec1e18","keyframes":{"transform":["translate3d(0px, 747.57000%, 0)","translate3d(0px, 0px, 0)"]},"delay":400,"duration":600,"easing":"cubic-bezier(0.2, 0.6, 0.0, 1)","fill":"both"}] [{"selector":"#anim-0f4ef39f-b404-48ce-9529-987228545285","keyframes":{"opacity":[0,1]},"delay":0,"duration":2000,"easing":"cubic-bezier(.3,0,.55,1)","fill":"both"}] [{"selector":"#anim-6fa384a9-63be-4208-9863-a5f98b8cc486","keyframes":{"transform":["scale(0.3333333333333333)","scale(1)"]},"delay":0,"duration":2000,"easing":"cubic-bezier(.3,0,.55,1)","fill":"forwards"}] Reserve some of your data just for testing the trained model to evaluate real-world performance. Don't use 100% for training as it can overfit.

Standardize Data

[{"selector":"#anim-b2d3560f-f8bd-41ad-8e4b-b144caf91643","keyframes":{"opacity":[1,1]},"delay":0,"duration":2000,"easing":"cubic-bezier(.3,0,.55,1)","fill":"both"}] [{"selector":"#anim-b532fe9e-ef32-47cb-8dc4-8640ec0f7628","keyframes":{"transform":["scale(3)","scale(1)"]},"delay":0,"duration":2000,"easing":"cubic-bezier(.3,0,.55,1)","fill":"forwards"}] [{"selector":"#anim-6503ea25-4bb4-4ab3-afff-07496d312b0d","keyframes":{"opacity":[0,1]},"delay":0,"duration":600,"easing":"cubic-bezier(0.2, 0.6, 0.0, 1)","fill":"both"}] [{"selector":"#anim-6b6111ad-158c-40f6-bb35-d853c71c3358","keyframes":{"transform":["translate3d(0px, 75.91351%, 0)","translate3d(0px, 0px, 0)"]},"delay":0,"duration":600,"easing":"cubic-bezier(0.2, 0.6, 0.0, 1)","fill":"both"}] [{"selector":"#anim-d8069d07-8a8c-4486-96ca-a8777f4c199d","keyframes":{"opacity":[0,1]},"delay":200,"duration":600,"easing":"cubic-bezier(0.2, 0.6, 0.0, 1)","fill":"both"}] [{"selector":"#anim-f09e448a-bf07-4279-a88f-f8efb86d64c5","keyframes":{"transform":["translate3d(0px, -862.25784%, 0)","translate3d(0px, 0px, 0)"]},"delay":200,"duration":600,"easing":"cubic-bezier(0.2, 0.6, 0.0, 1)","fill":"both"}] [{"selector":"#anim-ee6379fe-1e9b-4c6e-9954-b1479a3df20d","keyframes":{"opacity":[0,1]},"delay":400,"duration":600,"easing":"cubic-bezier(0.2, 0.6, 0.0, 1)","fill":"both"}] [{"selector":"#anim-2d2561f0-290e-4fef-90c8-ce08ad55cfff","keyframes":{"transform":["translate3d(0px, 747.57000%, 0)","translate3d(0px, 0px, 0)"]},"delay":400,"duration":600,"easing":"cubic-bezier(0.2, 0.6, 0.0, 1)","fill":"both"}] [{"selector":"#anim-9737e064-c045-4c1a-a474-9b0cfe3e9023","keyframes":{"opacity":[0,1]},"delay":0,"duration":2000,"easing":"cubic-bezier(.3,0,.55,1)","fill":"both"}] [{"selector":"#anim-b8e76edf-6ab4-473e-af32-608573dbcb3a","keyframes":{"transform":["scale(0.3333333333333333)","scale(1)"]},"delay":0,"duration":2000,"easing":"cubic-bezier(.3,0,.55,1)","fill":"forwards"}] Rescale input data to have a mean of 0 and standard deviation of 1. This normalization helps the network train faster and more accurately.

Add Regularization

[{"selector":"#anim-b548da2c-8259-4ad3-950e-dfabe490eb30","keyframes":{"opacity":[1,1]},"delay":0,"duration":2000,"easing":"cubic-bezier(.3,0,.55,1)","fill":"both"}] [{"selector":"#anim-3fb064e0-22cd-4eab-a261-9985f2822c03","keyframes":{"transform":["scale(3)","scale(1)"]},"delay":0,"duration":2000,"easing":"cubic-bezier(.3,0,.55,1)","fill":"forwards"}] [{"selector":"#anim-1d99910b-57ed-4660-84fd-ba7541c3ac2e","keyframes":{"opacity":[0,1]},"delay":0,"duration":600,"easing":"cubic-bezier(0.2, 0.6, 0.0, 1)","fill":"both"}] [{"selector":"#anim-f6485f23-503e-4b69-b387-04d189d5809a","keyframes":{"transform":["translate3d(0px, 75.91351%, 0)","translate3d(0px, 0px, 0)"]},"delay":0,"duration":600,"easing":"cubic-bezier(0.2, 0.6, 0.0, 1)","fill":"both"}] [{"selector":"#anim-1a51b3f3-b391-49a0-9a54-b422c4aceb2e","keyframes":{"opacity":[0,1]},"delay":200,"duration":600,"easing":"cubic-bezier(0.2, 0.6, 0.0, 1)","fill":"both"}] [{"selector":"#anim-6f69da5d-5af2-4d67-8267-66fcc5bc3493","keyframes":{"transform":["translate3d(0px, -862.25784%, 0)","translate3d(0px, 0px, 0)"]},"delay":200,"duration":600,"easing":"cubic-bezier(0.2, 0.6, 0.0, 1)","fill":"both"}] [{"selector":"#anim-e986c13b-af3e-4bc3-a5a3-f1a2a74e9762","keyframes":{"opacity":[0,1]},"delay":400,"duration":600,"easing":"cubic-bezier(0.2, 0.6, 0.0, 1)","fill":"both"}] [{"selector":"#anim-22d0b9ff-61f7-4451-99e5-437fe7cbacc0","keyframes":{"transform":["translate3d(0px, 747.57000%, 0)","translate3d(0px, 0px, 0)"]},"delay":400,"duration":600,"easing":"cubic-bezier(0.2, 0.6, 0.0, 1)","fill":"both"}] [{"selector":"#anim-bfa7b883-20cb-4092-bc3a-d3f17afc8139","keyframes":{"opacity":[0,1]},"delay":0,"duration":2000,"easing":"cubic-bezier(.3,0,.55,1)","fill":"both"}] [{"selector":"#anim-7344aef8-45ee-427f-876e-6346547425ad","keyframes":{"transform":["scale(0.3333333333333333)","scale(1)"]},"delay":0,"duration":2000,"easing":"cubic-bezier(.3,0,.55,1)","fill":"forwards"}] Techniques like dropout (randomly dropping neurons) and weight decay (shrinking weights) help prevent overfitting on just the training examples.

Stochastic Gradient Descent

[{"selector":"#anim-b82cdea0-4c0d-4b76-afc7-1445df016598","keyframes":{"opacity":[1,1]},"delay":0,"duration":2000,"easing":"cubic-bezier(.3,0,.55,1)","fill":"both"}] [{"selector":"#anim-f0274e74-9409-494d-858a-375a2ae03030","keyframes":{"transform":["scale(3)","scale(1)"]},"delay":0,"duration":2000,"easing":"cubic-bezier(.3,0,.55,1)","fill":"forwards"}] [{"selector":"#anim-6a84d48b-98d1-4512-b6f9-c1ef2f7ed9dc","keyframes":{"opacity":[0,1]},"delay":0,"duration":600,"easing":"cubic-bezier(0.2, 0.6, 0.0, 1)","fill":"both"}] [{"selector":"#anim-1bc5b05a-8f0e-4a0c-8041-22f01d749566","keyframes":{"transform":["translate3d(0px, 75.91351%, 0)","translate3d(0px, 0px, 0)"]},"delay":0,"duration":600,"easing":"cubic-bezier(0.2, 0.6, 0.0, 1)","fill":"both"}] [{"selector":"#anim-52587966-ff45-410b-9b1e-c7eed7eb0f19","keyframes":{"opacity":[0,1]},"delay":200,"duration":600,"easing":"cubic-bezier(0.2, 0.6, 0.0, 1)","fill":"both"}] [{"selector":"#anim-a9e56e1b-e335-4a1b-9b33-969facf0360c","keyframes":{"transform":["translate3d(0px, -862.25784%, 0)","translate3d(0px, 0px, 0)"]},"delay":200,"duration":600,"easing":"cubic-bezier(0.2, 0.6, 0.0, 1)","fill":"both"}] [{"selector":"#anim-06b88479-3d22-49a4-b54b-df4ae73677e6","keyframes":{"opacity":[0,1]},"delay":400,"duration":600,"easing":"cubic-bezier(0.2, 0.6, 0.0, 1)","fill":"both"}] [{"selector":"#anim-fe96f9a2-44f4-4813-ae1b-73b04080475c","keyframes":{"transform":["translate3d(0px, 747.57000%, 0)","translate3d(0px, 0px, 0)"]},"delay":400,"duration":600,"easing":"cubic-bezier(0.2, 0.6, 0.0, 1)","fill":"both"}] [{"selector":"#anim-4cab281c-a1c4-4fcf-86e5-e4b4f6769889","keyframes":{"opacity":[0,1]},"delay":0,"duration":2000,"easing":"cubic-bezier(.3,0,.55,1)","fill":"both"}] [{"selector":"#anim-f19c6f2d-5534-46c9-acc4-086474fb8e0e","keyframes":{"transform":["scale(0.3333333333333333)","scale(1)"]},"delay":0,"duration":2000,"easing":"cubic-bezier(.3,0,.55,1)","fill":"forwards"}] Updating weights gradually using small batches of data works better than updating weights all at once on all data.

Employ Learning Rate Decay

[{"selector":"#anim-cadfe95f-77ff-43a2-9a4b-1f5c54d2fed1","keyframes":{"opacity":[1,1]},"delay":0,"duration":2000,"easing":"cubic-bezier(.3,0,.55,1)","fill":"both"}] [{"selector":"#anim-10b7cb90-cf08-4199-be97-3acb99710cfd","keyframes":{"transform":["scale(3)","scale(1)"]},"delay":0,"duration":2000,"easing":"cubic-bezier(.3,0,.55,1)","fill":"forwards"}] [{"selector":"#anim-1d862488-b3d7-4566-adf8-27617e9c8195","keyframes":{"opacity":[0,1]},"delay":0,"duration":600,"easing":"cubic-bezier(0.2, 0.6, 0.0, 1)","fill":"both"}] [{"selector":"#anim-0cc06633-6f36-46a8-8d9a-389aa92c81a7","keyframes":{"transform":["translate3d(0px, 75.91351%, 0)","translate3d(0px, 0px, 0)"]},"delay":0,"duration":600,"easing":"cubic-bezier(0.2, 0.6, 0.0, 1)","fill":"both"}] [{"selector":"#anim-afe6e706-3499-496a-84d1-4aaa252032e7","keyframes":{"opacity":[0,1]},"delay":200,"duration":600,"easing":"cubic-bezier(0.2, 0.6, 0.0, 1)","fill":"both"}] [{"selector":"#anim-bdb23190-caad-48b5-a062-6285e6d14e3e","keyframes":{"transform":["translate3d(0px, -862.25784%, 0)","translate3d(0px, 0px, 0)"]},"delay":200,"duration":600,"easing":"cubic-bezier(0.2, 0.6, 0.0, 1)","fill":"both"}] [{"selector":"#anim-33e2b6ab-e9e3-48f3-80c2-3d24d9280c12","keyframes":{"opacity":[0,1]},"delay":400,"duration":600,"easing":"cubic-bezier(0.2, 0.6, 0.0, 1)","fill":"both"}] [{"selector":"#anim-d9e4b2be-ae19-4876-814e-a61570e1e3dd","keyframes":{"transform":["translate3d(0px, 747.57000%, 0)","translate3d(0px, 0px, 0)"]},"delay":400,"duration":600,"easing":"cubic-bezier(0.2, 0.6, 0.0, 1)","fill":"both"}] [{"selector":"#anim-93e24cf0-f979-4130-acbe-ea42bbbaf420","keyframes":{"opacity":[0,1]},"delay":0,"duration":2000,"easing":"cubic-bezier(.3,0,.55,1)","fill":"both"}] [{"selector":"#anim-575527af-cf8a-408c-bc20-a334768859a2","keyframes":{"transform":["scale(0.3333333333333333)","scale(1)"]},"delay":0,"duration":2000,"easing":"cubic-bezier(.3,0,.55,1)","fill":"forwards"}] Lower the learning rate slowly over training epochs so network converges precisely. A fixed high LR can overshoot.

Analyze Model Capacity

[{"selector":"#anim-45d5ae48-e620-4867-83d3-da13a8085292","keyframes":{"opacity":[1,1]},"delay":0,"duration":2000,"easing":"cubic-bezier(.3,0,.55,1)","fill":"both"}] [{"selector":"#anim-a3c70da3-b1f7-4677-9020-1ae1540d416f","keyframes":{"transform":["scale(3)","scale(1)"]},"delay":0,"duration":2000,"easing":"cubic-bezier(.3,0,.55,1)","fill":"forwards"}] [{"selector":"#anim-f5f4b736-ba0e-4848-a04b-3e9bb90e2b73","keyframes":{"opacity":[0,1]},"delay":0,"duration":600,"easing":"cubic-bezier(0.2, 0.6, 0.0, 1)","fill":"both"}] [{"selector":"#anim-775a323c-5ef1-4a3a-9d8f-67e9eb2ce34e","keyframes":{"transform":["translate3d(0px, 75.91351%, 0)","translate3d(0px, 0px, 0)"]},"delay":0,"duration":600,"easing":"cubic-bezier(0.2, 0.6, 0.0, 1)","fill":"both"}] [{"selector":"#anim-2ada5d01-26d0-4033-8c74-440edb4a2f64","keyframes":{"opacity":[0,1]},"delay":200,"duration":600,"easing":"cubic-bezier(0.2, 0.6, 0.0, 1)","fill":"both"}] [{"selector":"#anim-03633019-dd73-46ce-82f1-9cf6e347b212","keyframes":{"transform":["translate3d(0px, -862.25784%, 0)","translate3d(0px, 0px, 0)"]},"delay":200,"duration":600,"easing":"cubic-bezier(0.2, 0.6, 0.0, 1)","fill":"both"}] [{"selector":"#anim-c2fe5fdf-7284-4729-a620-fc96d288439a","keyframes":{"opacity":[0,1]},"delay":400,"duration":600,"easing":"cubic-bezier(0.2, 0.6, 0.0, 1)","fill":"both"}] [{"selector":"#anim-4e1e50ea-ebfb-4e36-84f6-7437aacb1bc2","keyframes":{"transform":["translate3d(0px, 747.57000%, 0)","translate3d(0px, 0px, 0)"]},"delay":400,"duration":600,"easing":"cubic-bezier(0.2, 0.6, 0.0, 1)","fill":"both"}] [{"selector":"#anim-a6104a3c-e0c2-4a2c-b010-a03926a1fc06","keyframes":{"opacity":[0,1]},"delay":0,"duration":2000,"easing":"cubic-bezier(.3,0,.55,1)","fill":"both"}] [{"selector":"#anim-ffc7ed4c-d607-4c1a-a66d-27c2454c32e7","keyframes":{"transform":["scale(0.3333333333333333)","scale(1)"]},"delay":0,"duration":2000,"easing":"cubic-bezier(.3,0,.55,1)","fill":"forwards"}] If model underfits training data, increase parameters/layers. If it overfits, reduce capacity to generalize better.

Visualize Layers

[{"selector":"#anim-836c8084-c959-47da-b7d1-6a75a7bd70a3","keyframes":{"opacity":[1,1]},"delay":0,"duration":2000,"easing":"cubic-bezier(.3,0,.55,1)","fill":"both"}] [{"selector":"#anim-5f7f738c-c52f-4093-ae71-c04f57424eb9","keyframes":{"transform":["scale(3)","scale(1)"]},"delay":0,"duration":2000,"easing":"cubic-bezier(.3,0,.55,1)","fill":"forwards"}] [{"selector":"#anim-5e211b4f-e22f-4305-9a1a-03be6d5e1cb1","keyframes":{"opacity":[0,1]},"delay":0,"duration":600,"easing":"cubic-bezier(0.2, 0.6, 0.0, 1)","fill":"both"}] [{"selector":"#anim-86f23af5-952f-4500-b1aa-bc37fe7555af","keyframes":{"transform":["translate3d(0px, 75.91351%, 0)","translate3d(0px, 0px, 0)"]},"delay":0,"duration":600,"easing":"cubic-bezier(0.2, 0.6, 0.0, 1)","fill":"both"}] [{"selector":"#anim-042bfa23-fdbf-4f5b-a942-52f05aab9769","keyframes":{"opacity":[0,1]},"delay":200,"duration":600,"easing":"cubic-bezier(0.2, 0.6, 0.0, 1)","fill":"both"}] [{"selector":"#anim-b189c307-db91-4e17-b111-9618dbc09f59","keyframes":{"transform":["translate3d(0px, -862.25784%, 0)","translate3d(0px, 0px, 0)"]},"delay":200,"duration":600,"easing":"cubic-bezier(0.2, 0.6, 0.0, 1)","fill":"both"}] [{"selector":"#anim-ced0377e-8296-4f40-9ce0-2e0704035834","keyframes":{"opacity":[0,1]},"delay":400,"duration":600,"easing":"cubic-bezier(0.2, 0.6, 0.0, 1)","fill":"both"}] [{"selector":"#anim-0c7ad7c6-dd47-446d-ad66-e7b2f3917935","keyframes":{"transform":["translate3d(0px, 747.57000%, 0)","translate3d(0px, 0px, 0)"]},"delay":400,"duration":600,"easing":"cubic-bezier(0.2, 0.6, 0.0, 1)","fill":"both"}] [{"selector":"#anim-d4dbb747-2682-41a7-9ea2-d5cf788182eb","keyframes":{"opacity":[0,1]},"delay":0,"duration":2000,"easing":"cubic-bezier(.3,0,.55,1)","fill":"both"}] [{"selector":"#anim-835bfbbb-d5e8-444b-b20c-f0a8daedb2db","keyframes":{"transform":["scale(0.3333333333333333)","scale(1)"]},"delay":0,"duration":2000,"easing":"cubic-bezier(.3,0,.55,1)","fill":"forwards"}] Plotting activations and weights at each layer provides insight into how well the network is learning feature representations.

[{"selector":"#anim-83fbf5ea-cbed-45fc-a16e-e0c001ea7216","keyframes":{"opacity":[0,1]},"delay":0,"duration":600,"easing":"cubic-bezier(0.2, 0.6, 0.0, 1)","fill":"both"}] [{"selector":"#anim-9e30d3a6-d053-4ed9-8dec-3755fde310fe","keyframes":{"transform":["translate3d(0px, 75.91351%, 0)","translate3d(0px, 0px, 0)"]},"delay":0,"duration":600,"easing":"cubic-bezier(0.2, 0.6, 0.0, 1)","fill":"both"}] [{"selector":"#anim-47213d46-6ccb-47c9-8976-1cbb904a07ca","keyframes":{"transform":["translate3d(-54.54544%, 0px, 0)","translate3d(0px, 0px, 0)"]},"delay":500,"duration":1000,"easing":"cubic-bezier(.2, 0, .8, 1)","fill":"both"}] [{"selector":"#anim-2448c6e5-fed3-4e84-9b54-d18135d6b0cc","keyframes":{"transform":["rotateZ(-180deg)","rotateZ(0deg)"]},"delay":500,"duration":1000,"easing":"cubic-bezier(.2, 0, .5, 1)","fill":"forwards"}] [{"selector":"#anim-fb34c4a6-10b8-4ecb-876d-90845ceb94d9","keyframes":{"opacity":[0,1]},"delay":0,"duration":2000,"easing":"cubic-bezier(.3,0,.55,1)","fill":"both"}] [{"selector":"#anim-b7e9a537-171c-41f7-b394-23c709a5fec3","keyframes":{"transform":["scale(0.3333333333333333)","scale(1)"]},"delay":0,"duration":2000,"easing":"cubic-bezier(.3,0,.55,1)","fill":"forwards"}] [{"selector":"#anim-dbdaf03f-3d96-4ad3-a0cd-895bea2f3e4a","keyframes":{"transform":["translate3d(54.54548%, 0px, 0)","translate3d(0px, 0px, 0)"]},"delay":800,"duration":1000,"easing":"cubic-bezier(.2, 0, .8, 1)","fill":"both"}] [{"selector":"#anim-6ba4e216-c133-49da-bc8a-23829a1747d1","keyframes":{"transform":["rotateZ(180deg)","rotateZ(0deg)"]},"delay":800,"duration":1000,"easing":"cubic-bezier(.2, 0, .5, 1)","fill":"forwards"}] [{"selector":"#anim-44814acb-7d35-4f89-a15c-6ee30a909568","keyframes":{"opacity":[1,1]},"delay":0,"duration":2000,"easing":"cubic-bezier(.3,0,.55,1)","fill":"both"}] [{"selector":"#anim-8adcf197-8890-4263-a129-d967649b2f0f","keyframes":{"transform":["scale(3)","scale(1)"]},"delay":0,"duration":2000,"easing":"cubic-bezier(.3,0,.55,1)","fill":"forwards"}] Don't be intimidated by neural networks. With fundamental datasets, starter code libraries, and core techniques like regularization, stochastic gradient descent, and capacity control, virtually anyone can successfully train their first AI.